首页 科技正文

大日本印刷与 NHK 合作开发情感表达字幕系统,透过 AI 分析自动帮字幕加上特效 #广播电视 (155952)

大日本印刷与 NHK 合作开发情感表达字幕系统,透过 AI 分析自动帮字幕加上特效 #广播电视 (155952) 科技应用 图片来源 机器视觉 字幕 广播电视 说话者 特效字体 我不 入地狱 第1张

在综艺节目为了强调临场感,除了主持人与艺人的演出外,透过字幕特效加深印象也是惯用的方式,不过这些特效是需要经过人工方式处理,故对于后制人员也会造成负担;而大日本印刷与 NHK Technologies 合作开发一套情表达字幕系统,透过 AI 进行人物的影像分析,自动为字幕加上合适的特效。

大日本印刷与 NHK 合作开发情感表达字幕系统,透过 AI 分析自动帮字幕加上特效 #广播电视 (155952) 科技应用 图片来源 机器视觉 字幕 广播电视 说话者 特效字体 我不 入地狱 第2张

▲下图为一般字幕,上面为透过 AI 加入效果的字幕(图片来源:大日本印刷)

大日本印刷与 NHK 合作开发情感表达字幕系统,透过 AI 分析自动帮字幕加上特效 #广播电视 (155952) 科技应用 图片来源 机器视觉 字幕 广播电视 说话者 特效字体 我不 入地狱 第2张

▲借由分析说话者的表情,可搭配合适的特效字体(图片来源:大日本印刷)

情感表达字幕系统的开发经纬是考虑到听力障碍与老年人观看的节目,在缺乏声音的情况下,传统的标准字体有时无法难以分辨说话者,虽然特效字体有时会有难以阅读的问题,但更容易搭配表情感受节目内容。

这套系统还在原型阶段,其字体是应用大日本印刷在 2018 年的 DNP 情感表达字体,借由 AI 对影像中人物的语气以及表情进行分析,可自动辨识并自 DNP 情感表达字体挑出合宜的特效字体,除了强化戏剧效果,亦更容易对听力不佳或是听障人士传达情感。

大日本印刷与 NHK 合作开发情感表达字幕系统,透过 AI 分析自动帮字幕加上特效 #广播电视 (155952) 科技应用 图片来源 机器视觉 字幕 广播电视 说话者 特效字体 我不 入地狱 第2张

▲搭配 12 种 DNP 情感表达字体呈现当下的气氛(图片来源:大日本印刷)

情感表达字幕系统能够实现即时的影像与声音分析,并即刻加上字幕,系统可从 12 种 DNP 情感表达字体挑选最适合呈现当下气氛的字体,此外借由影像分析,可把字幕安排在离说话者最接近的位置,使观看者更容易把字幕与说话者连结。

未来除了持续强化情感表达字幕系统的 AI 辨识性能与提高即时辨识与字幕插入性能,最终目标是希望能把这套系统投入实际的 Live 节目与网路直播,同时希望未来能将这套系统导入大众能够使用的影像编辑软体。

科技应用
转载说明:本文转载自互联网,如有侵犯你的利益,请发邮件至本站邮箱,本站24小时内将予删除。
来自未来的 MAD Gaze Watch 智慧手表:弹指拍照、隔空操控简报,不用修炼成魔法师也做得到 #骨传导精准演算法技术 (155935)

随着智慧型穿戴装置普及,许多 3C 大厂相继推出功能各色的智慧手表,不过能像 MAD Gaze Watch 智慧手表,透过「手势变化」隔空操作拍照、接听电话、播放音乐的智慧手表,却是十分少见。 MAD Gaze Watch 单手就能操控的特点,解决了一般智慧手表触控不易的问题,它还支援 IoT 连线,摇身变为简报控制器或 AR 游戏遥控器, 为生活带来难以想像的便利性。外观开箱与基本操作:时尚大表面让资讯显示更清晰 除了便捷的手势操作功能,MAD Gaze Watch 也以「一表抵一机」的气势,包办了大部分智慧装置功能,不仅能接听通话,还可以直接回复手机讯息,几乎等于带了一只小型智慧手机出门;独创的骨传导技术也受到国际瞩目,受邀参展 2020 年 CES (美国最大国际消费性电子展)。 仅用文字形容还不足以展现它的厉害之处,赶紧往下看看开箱评测吧! ▲MAD Gaze Watch 外层包装。 ▲MAD Gaze Watch 外包装采简约现代风格,内

版权声明

本文仅代表作者观点,
不代表本站Allbet Gaming的立场。
本文系作者授权发表,未经许可,不得转载。

评论