テレワークの拡大による議事録作成サービス 速記者に任せる時代からAIが担う時代へ

コロナ感染の影響が、音声認識機能を高める技術を加速度的に高めております。そう、私たちが日常に使う言葉を、音声として何度もAI(人工知能)に認識させ、それを記録させる技術です。

 通常会話のみならず、今では会議の場において、いろいろな発言が飛び交う中で、誰が発言したのかについても、しっかり特定できます。ただ、発言が重なってしまったり、同音異義語の識別については、明確性に欠けるところもあるようですね。

 英語の文字起こしでは、プロの速記者でも5.1%のミスを犯すという研究結果があります。他方、AIに会話のやり取りを10万回学習させることで、その都度、認識精度を5%高められるというサービス業者も出てきました。この1年以内に、どんな環境であっても98%以上の認識精度が実現できると、この業者も豪語しておりますから、そうなっていくのでしょう。

 ただ、英語と違って日本語は、同音異義語や句読点の打ち方など、言葉の壁は高いようです。やはり、文字起こしの精度を確実に高めるその起点となるのは、データの収集方法にかかっていると言われております。国内企業のみならず、海外勢もさらに加わり、激しい企業間競争が交わされる中、技術革新が行われいくことに期待したいものです。 コロナに負けるな!