短信预约提醒成功
电脑速记技术是传统手写速记和计算机相结合的产物,它可以使语音信息即时转化为电子文本,可以做到“会议毕,文稿出”。语音识别技术是让机器通过识别和理解语音信号而转化为相应文本或命令的高技术。由于语音信息具有连续性、多变性、动态性、瞬时性的特点,造成了语音识别的难度远远不像人们想像的那样简单--对着电脑的麦克风一说,字马上就会出来了。它的识别难度它在于和不同的说话人、不同的说话速度、不同的说话内容以及不同的环境条件有关。
作为中文信息处理的工具,语音识别技术和电脑速记技术都是把稍纵即逝的语音信息转化成文字,但二者的关系除了速记与录音机的不同点相似外,还有以下几点:
1、同音字、词处理的问题转自环 球 网 校edu24ol.com
现代汉语中的大量同音字、词一直是中文信息处理电脑化的瓶颈。电脑速记、语音识别在记录语音信息时都会遇到这个难题,关键是记录的准确率。如``以同等 xueli考研``是这个``学历``还是这个``学力``;``秘书人员要正确领会领导shouyi``是这个``授意``还是这个``受意``等,即使是语音识别能够完全记录下语音信息,而且能够达到百分之百的准确率,其功能仍然和录音机一样(二者的关系见上文),同样需要人们的后期加工整理,这样花费的时间要比人在当时记录的时候要多得多。因为人在讲话时,往往是口语,从口语到书面语的转化,并不单纯是落成了文字。
2、人们在理解语言时,可以根据语音之间的停顿、语调、语气等,把声音信息变成转化文字,并实时添加相应的标点符号。语音识别在理解语言时,需要说出标点符号的具体名称,因为机器在理解语言时,需要*断句来理解的:``王处长冒号您从哪儿来问号另起一自然段空两格今天的政治学习内容是前书名号邓小平理论后书名号``,事实上人说话时是不说出标点符号的具体名称的,这样会很别扭。
语音识别在理解语言时会遇到字符正确串切分和对句子结构的理解问题。如``美国会考虑战略导弹防御系统``是``美国/会/考虑/战略导弹防御系统``还是``美/国会/考虑/战略导弹防御系统``呢?``他yihuier/jiulai``本来是``他一会儿就来``往往会理解成``他一挥而就来``;``要及时把握……``语音识别就很可能会切分成``药剂师把握……``。电脑速记是由人脑对语言信息进行切分,加入标点符号、分段的。
3、语音识别软件对语料内容要求严格,需要人们说标准的汉语普通话,如果有方言、口音、土语等识别起来相当难,而且要事先进行发言人口音适应。尽管如此,文秘速记人员如果能够听得懂,一般都能够记录下来,也要求文秘速记人员必须具有广阔的知识面,听得多了,记录的信息也就准确得多了,这也是文秘速记人员往往会比一般人辨别、采集语音信息能力强的原因。如果方言特别重的人讲话,人都听不懂,机器也就更难听懂了。
4、语音识别只能识别单一的汉语语音信息,对于其他有声信息都会被其认为是噪音而影响其识别的准确率。例如,在正在播放有背景音乐的朗诵词里提取男女对话的汉语信息,转化成文字,麦克风根本无法识别。
语音识别无法理解和识别交互式有声信息,比如座谈、讨论、会谈等多人发言时,麦克风无法辨识是哪位发言的信息,也不能只记录这位发言人的信息,而把别的发言人的声音信息阻隔在外。电脑速记技术由于是由人来把握,不但可以记录下每个人的发言内容,还可以记录下当时的场景,这样的信息就会很丰富、生动。
5、新生事物的出现而产生的新词语以及人名、地名等专业词语,人们可以根据对语音信息的理解,选定具体是哪个字或词。速记技术在记录语言时,可以对同音字(词)进行实时处理,以保证一次性在准确率95%以上,这也是为什么电脑速记的出现,能够得到社会认可的原因,也是速记技术高效率的具体体现。由于汉语词汇的丰富无限性和可扩展性特点,为了提高语音识别的准确率,必须对人名、地名、新词语等专业词语事先限定,把词汇做入电脑语料库里,但是实际操作起来不现实。例如用语音识别记录即将召开的党的十六大代表发言、讨论内容,往往不可能让所有的代表都来事先对麦克风把发言内容说一遍,适应一下口音,把相关词语事先录入进去,这样的话,就变成了现在是开会了。
6、信息化现代化、信息国际化的社会发展进程出现了一种新的语言表达方式--中英文语音信息混合表达的现象,而且正在成为一种发展趋势。比如``上海 APEC会议``、``WINDOWS98/XP系统````请王秘书把客户的合同草案fai ke si(FAX)或E(E-mail)过来``,文秘速记人员在记录时,只要能够听得懂英文单词,就可以把它即时翻译记录成``请王秘书把客户的合同草案传真或电邮过来``;另外,当些外来词语传入我国时,因为是前沿话题,一时半时人们还找不到一个合适的中文词语和造出一个新词词来代替,同样会出现中文信息和外文信息混杂的情况,让语音识别软件去识别成全中文信息呢还是中外文混合信息呢?准确率能够达到多少?这也有速记文秘人员提出了新的挑战,成长为一名优秀的文秘速记人员仅仅具备很高的记录速度是远远不够的。
7、电脑速记技术是语文现代化和中文信息处理的一个组成部分,汉语语音信息国际互联网上同步字幕直播的高效率成为现实。无论是手写速记还是电脑速记,都是以汉语拼音方案为基础的,是深深植根于汉民族语言的技术,随着汉语的发展而发展,只要说汉语就有用速记存在的地方,而说别的语言又会变成别的语种的速记了。信息社会越发展,越需要处理信息的高效率,中文电脑速记技术正是这样一个记录、处理语言信息的高效率手段,它的出现与被应用,正是信息社会发展的必然产物和人们处理信息高效率的必然趋势。
总之,语音识别技术和电脑速记技术工作方式方法具有本质的不同,一个是机芯在工作,一个是人脑在工作,是人脑对语音信息的再创造。语音识别无论怎样智能,也无法取代人脑的智力。