また、空気読まずに、ご紹介しておきますよ(*´꒳`∩)
あまり興味ないですか?ほんとに?大学生とか学生生活変わるよ?きっと。
まえおき
前回、この音声文字変換アプリを紹介したのは2月28日なので、Google I/O 2019より前になるんですが、実はこの子、プロジェクトユーフォニアに噛んでたスゴい子だった!
だというのにwww とにかくあまり反響がなかったw なさすぎたwwww_(:3 」∠)_
ホントにスゴいんです。もう一回いいますよ?ホントにスゴいんですよ、スゴすぎて震えるくらい。何がスゴいって、音声認識力がエグい。
なんだろう、なんて言えばいいか、うん、そう、もうね、わたしの耳より多分いい。
前に書いた記事に動画貼ってあるので良かったら見て。スゴいから。
次回の新機能が公開
でね、来月の更新で来る新機能が公式ブログに公開されたのですけど、もうこれがホントにスゴくて。
- Live Transcribe新機能
- 環境音を聞き分けるようになった
- 音声を文字として起こしたあと3日間自動保存&範囲選択してコピーできるようになった
ね?スゴいんでしょ?
……ォゥヶ〜ィ、説明しましょう(*´꒳`∩)
環境音を聞き分ける
もともと、このアプリの機能は、入力された音声を文字に起こす、っていうものなんですが、その反応速度と正確性が両方兼ね備わっているっていうエグいアプリでした。
次回追加される環境音を聞き分ける機能は、ここに、口笛だったり犬の鳴き声だったりが入ってた場合、下に口笛とか、犬とか、サウンドイベントをアイコン表示するようになった、というもの。
へえー。
って顔した?
これの何がスゴいって、音声認識のエンジンが、その場に何があるかを、音だけで聴き分けるようになってるってことなんです。
エグい。これはエグいよ。
たとえばこれ、写真で言い換えると、写真を撮って画像編集アプリに読み込んだら、読み込んだ時点で、自動で人物と背景のレイヤーが別れた状態になってるってことですよ?
もうAIは、視覚に頼ることなく、世界を認識できる。
そのうちこれ、遠くで聞こえてる声とかも判別できるようになって、小声とかも聞き分けて、で、音声の距離とか把握できるようになったら、遠い位置にいる人物が喋ってる言葉だけ抽出できるようになるかもしんないよね。
奥行きも認識できるようになったら、位置関係を推測して、視覚的な再現配置とかにも使えちゃうよね。
これはもう革命なんだけど。わかります?この感動?www
文字起こし後の自動保存とコピー
いままでは、喋った声を文字で起こすだけだけだったんですけど、次回から3日間自動保存してくれるようになります。加えて、その文字列を範囲選択してコピーできるようになります。
はぁ、って感じですか?違うんです。
例えば、ゲームとかのプレイヤーコミュニティー振興目的の生放送とかあるじゃないですか。
FF14のYouTube Liveとか。
DQ10のニコ生とか。
あれを対象にしたら、自動で文字に起こしてくれるわけですよ。
しかも自動保存するわけじゃないですか。
今、生放送でPが言ったことツイートしたい!でも文字入力してる場合じゃねえ、ってことあるでしょ?
あれ、コピペできるわけ。
これはね、いままでスゴい大変だった、生放送の文字起こしが手軽にできちゃうんですよね。
マイディーさんとか大助かりなんじゃないの。まだやってるか知らんけどw
その昔、DQXのニコ生をツイッターに文字と写真で起こして速報してたわたしにとっては革命ですよ。
大革命。
これが学生時代にあったと仮定したら、授業中の先生の話はこれで文字に起こして保存しておけばいいわけですよね。もう、どれだけ勉強がはかどるか、計り知れない\=͟͟͞͞(꒪ᗜ꒪ ‧̣̥̇)/
あと文字起こしからデータ作る業の人とか、わかってもらえると思うんですけど、つまりこれ、インタビューなんかをその場でテキストに起こした上に3日間自動保存してくれるってことなので、現地で記事にするときスゴい楽な上に、うっかりしてても3日間保存してくれるんですよ?
スケジュール
はぁー、もうAIの進化ハンパないわね(*´꒳`∩)
公開は来月らしいとのことですが、来月となると6月3日に来るセキュリティアップデートか、6月5日に来ると思われるAndroid 10 Q Beta4あたりがあやしいです。
その頃にまた、試してみます。わたしのPixel 3 XLちゃんにアップデート来たら。