WADA-blog(わだぶろぐ)
ニッチテーマでサイトを企画・制作し広告収入で暮らすミニサイト作り職人だった(←引退しました)自由人わだのブログ。製品レビューに小型バイク、セルフリノベ、家庭菜園、IoTまで好奇心のおもむくまま。
2022年02月:音声入力マスター
音声入力で長い文章作成できるようにしたい。そのためには何を使い、どんな環境を整えたらいいのか、音声入力をスムーズにできるようになると何が変わるのか。AI進化で音声解析技術が急激に進化する中、それを使いこなせるように私も自分をアップデートしたい♪

2月は音声入力マスター

気付けば2月も20日が過ぎ、残すはあと1週間になってしまいましたが、今月のテーマは「音声入力」です。このテーマを選んだ理由はいくつかあります。

もうかなり前、音声で長文を入力することに真剣に取り組んでいた頃があります。かれこれ15年以上前だと思いますが、受託仕事で取材をし1時間にわたる録音内容の文字起こしが必要でした。

タイピングは割と早いほうなので、再生速度を遅くすればタイピングでもぎりぎり追いつくのですが、それをやると指の疲弊が半端ありません。それでドラゴンスピーチというソフトを購入し、専用のヘッドセットを購入し、ICレコーダの録音をイヤフォンで聞きながら、それを音声ではっきり読上げて文字にしてゆくということをしたのです。

当時はまだ、それほど音声解析が進んではいないので、学習済みの人の声ではっきりと読上げないとダメでしたし、実際もう一度かなり時間をかけて手直しをしなければ使えない文章でした。

ただAIの進化・ディープラーニングによって、今の音声解析は目を見張るものがあります。例えば昨年秋から実家スマートホーム化に取り組んでいますが、70代も終わりの私の母親が噛みながら話す言葉すら正確に聞き取り、しかも「きっとこれが必要なのだろう」と推察までしてくれ、アクションしてくれる。ほんとすごい。

今なら、サイトの記事の下書きも、音声入力だけでストレスなく作成できるかもしれない。

何を使ったらベストなのか、どういった環境を整えればよりスムーズに音声入力できるのか。いい機会なので試行錯誤してみたいなと思います。

今月も残すところ一週間。今日からスタートします!