外祖母一直是个倔强的小老太太,家里人怎么劝都坚决不放弃自己的粉红翻盖手机,可是随着疫情不断反复,没有健康码连菜市场都进不去的外祖母终于急了,终于换上了智能手机。
自从小辈们教会外祖母使用微信,顾及到老太太的老花眼,发语音就成了家族群的常态。
老太太一发就是一长串,有时候出门在外,难免会有不方便听的时候。每每此时,大家就不禁感叹微信的语音转文字功能是多么便捷。
文字、语音都是为交流服务的,而科技的进步也让交流变得更加快捷。在语音转文字、文字合成语音等“黑科技”的背后,蕴含着哪些巧妙、实用、改变人们生活的技术呢?这些源自生活的研究,能否为中学科研带来灵感呢?
社恐福音:语音转文字
语音识别是一门非常复杂的学科,包含了声学、信号处理、计算机科学、语言学、心理学等相关学科的知识,也是十年来发展最快的技术之一,并已经渗透到了人们的生活中,比如微信语音转文字功能。
19年微信语音添加了语音转文字功能后,解决了某些场合不方便听语音的难题,并且经过几年技术优化,一部分方言的识别也得以实现。
“再也不用担心上学/上班时家里人发语音,又不方便戴耳机听的情况啦!"
语音转文字的出现,不仅满足了不同场景下人们的社交需求,还可以应用到记录工具,将声音转换为文字,便于工作学习等的记录,提高效率。
从文字到语音的“逆发展”
外祖母老花眼,看手机信息还要带上老花镜,所以家里人都尽量给她发语音,但是总有不方便说话的时候,这就需要语音合成技术的帮忙了。
语音合成又称文本语音转换(Text to Speech,TTS)技术,顾名思义,是把文本信息转化成语音信息。
在2011年9月20日iPhone4S的发布会上,苹果高管与手机中Siri的对话被媒体称是人工智能和人类的一次经典问答,语音助手也逐渐进入到大众视野。
语音助手的出现,依托于5G技术与人工智能技术。人们与语音助手对话时,它们在数据库搜索相关信息,再模拟人类的声音表达出来,实现由字到音的转化。
小到手机中的智能语音助手,大到物联网智能家居,智能工厂等……可以预见在未来某些情境下,语音指令或将逐步代替文字指令。
语音合成技术被大众所知是因为语音助手,“机器朗读”有声书的出现,才让这项技术真正广泛地应用到实际生活中。
语音合成技术将文字转换合成为可理解的自然语音,这在人机交互过程中具有着极为重要的意义。
不只是“机器朗读”有声书,我们在看视频时,经常会听到一些机器合成的配音,用声调平淡、发音机械的声音读出诙谐风趣的句子,其反差经常让人捧腹大笑。
国内不少学者在研究中指出,“【声音】在未来传播中将回归主流介质”。语音合成技术的不断进步影响着交流速度、交互性、可及性的改变,从而创造了新的社交语境和文化,改变人们的日常生活。
翰林有方W老师也曾在讲座中分享过:中学生选题做科研时,要学会立足于实际生活,注重观察,在日常生活中学会发现问题,解决问题。
无论是语音转文字,还是用文字合成语音,都是生活中常见的技术应用,它们同样可以作为研究主体,并且解决实际问题。如果你也对语音合成有兴趣,不妨了解下这个课题。
课题介绍
课题名称: 基于神经网络的语音合成
相关学科:计算机科学技术
课题介绍:本研究课题预期通过深度网络模型进行语音合成,将文本通过网络学习生成对应的发音。通过本项目的研究会提出一种语音合成方法,能够提升合成语音的自然度以及对应MOS打分。最终实验会在公开数据集LJ speech上进行语音合成。
导师介绍
复旦大学计算机博士,国内某高科技公司高级算法研究员;
研究领域:文本语音合成(TTS),音乐人工智能,音乐信息检索,语音检测,歌手识别等;
发表多篇SCI和国际顶会论文,曾申请多项国家级专利;
有多年中学生、本科生教学经验。
联系我们,开始你的科研之路
扫码添加翰林顾问老师,咨询了解
翰林有方本周新课题推荐
© 2024. All Rights Reserved. 沪ICP备2023009024号-1