43号線を西へ東へ

フリーランスの備忘録、アウトプットの実験場

音声入力記事ついて過去記事をまとめてみた

このブログはプロモーションリンクを含むときがあります


iPhoneWindowsで音声入力をちょこちょこ使っています。胸を張って使いまくっているわけではないですが、車の運転中はそれしか入力方法がありませんのでしかたなく使っています。

iPhoneWindowsの音声入力について、過去に調べて書いた記事が4本ありました。すべて2023年8月に書いた記事です。もう4ヶ月も前の話ですね。振り返るためにまとめ記事を作成してみました。

音声入力でブログは書けるのか?

友人に教えてもらった音声入力を試した際、その精度に感動して書いた記事です。iOS 16におけるiPhoneの音声入力機能の驚異的な進化に驚きました。

車内で音声入力を使用してブログの下書きを作成した際、高い精度とスピードに感銘を受けました。以前は実用的でなかった音声入力が、今では多少の専門用語も正確に入力できるようになっていました。もちろん修正は必要ですが、ブログの下書き作成に十分活用できると思いました。本文中には、車内で音声入力した文章を、誤字などを修正せずにそのまま載せています。

iPhoneの音声入力はネット接続が必要?

iOS 16で進化したiPhoneの音声入力機能の設定方法をステップバイステップでまとめてみました。音声入力の設定方法や自動句読点の機能などが設定できます。さらには運転中にSiriを使用してメモを取る方法について説明しました。

最後にオフラインモードで使ってみて、iPhone単体で音声入力を行っていることを実証しました。

WindowsiPhoneの音声入力機能を比べてみた

本記事では、Windows 11とiPhoneの音声入力機能を比較検証しています。Windows 11の音声入力では、空白期間の処理に問題があり、私の話すテンポでは実用性に欠けると判断しました。少し発話が途切れるとすぐに「。句点」が入力されるのです。

対照的に、iPhoneの音声入力はそのあたりが柔軟に対応してくれます。発話が途切れても前後の文脈から句読点を自動的に追加し、誤りの修正が可能で、より高精度で実用的でした。

また標準メモアプリでは入力された文字列の修正ができるのに対し、Notionアプリでは入力された文字は確定されてしまう状態でした。

iPhoneの音声入力と、Notion AIの文章校正機能を組み合わせてみた

この記事では、運転中の空き時間を効率的に活用する方法を紹介しました。具体的には、iPhoneの音声入力機能を使用してアイデアをメモし、Notion AIを活用して誤字脱字のチェックやToDoリストの作成を行う方法について述べました。

また、音声入力しやすいMarkdownの記号を載せています。

下記の別記事になりますが、だらだら長文を話してしまっても、Notion AIがすっきりまとめてくれるので、うっかり長文になってしまった文章も見直しやすいです。また、誤字脱字チェックも可能なのはありがたいとことです。

Pixel 8に搭載されたAIがスゴイらしい

外部リンクになりますが、前日発売されたPixel 8のに搭載されたAIによって音声認識の精度はさらに向上されているようです。

AI技術を活用した「クリア音声通話」は通話中の雑音を減らし、「音声消しゴムマジック」機能は動画内の雑音を低減し、クリアな音声を提供します。そして、自動言語認識機能は複数の言語を混在させた音声入力や文字起こしを可能にします。これらの機能は、Pixel 8シリーズに搭載されたTensor G3チップによって大幅に強化されているそうです。

音声入力の質を上げるには、日本語の解析技術も必要ですが、音声をクリアにすることで音声認識の精度を高めているということでしょうか。

iPhoneにもAI搭載予定

次のiPhoneにもオフラインで使えるAIが搭載されるそうです。プライバシー対策からか、端末内データを扱うAIとネットアクセスするAIの二本立てのようですね。来年のことですが、どのような機能が追加されるのか楽しみです。

最後に

過去に音声入力について調べた記事、まとめた記事をまとめてみました。最近はATOKを使い出して音声入力熱も少し冷めておりましたが、適材適所で活用してきたいと思います。