私はWEB上の読み物を合成音声ソフトにコピペして音声データ化し、それをラジオにするということをよくしています。よくしているというか、毎日しています。
その音声データを聴きながら散歩や家事などをするわけですね。何か情報を得ながらの方が余計なことを考えなくて済むので。アイデアを出したい時などは耳から情報を入れないようにしますが。
そういうことをしている間に、様々なWEBサービスを駆使して音声データを作るようになっていたので、ちょっとまとめてみます。
以下は他人の著作物をコピペする行為です。それを勝手にWEBに公開したりしてはいけません。もしやる場合は個人利用の範囲で!!!
音声合成ソフト
以前は無料のSoftalk(所謂ゆっくりボイス)を利用していたのですが、最近はもっぱら有料のVOICEPEAKを使っています。小春六花ちゃん!
それ以外の音声ソフトは使ったことがないのですが、基本の仕組みが同じならVOICEVOXやボイロ、A.I.VOICEなどでもやれるはず?
私の読み上げ用調声はこんな感じ。
- たくさん読んでほしいのでスピードは気持ち早めに
- たくさん読んでほしいのでポーズはゼロに(ポーズが長いと間が長くなってイライラします)
- このソフトにはナレーション特化のパラメータがあるのでそれをマックスに
- ナレーションマックスだとやや暗いので、ピッチやハイテンションで明るめに調整
それで、出力される音声はこれです
この声をマジで数百時間、下手したら累計千時間以上聴いてると思う
調声については個々人の好みもあると思いますので、自分が長時間聞いていても問題ない・好ましいようにチューニングするのがよいですね。
辞書周り
私の使っているVOICEPEAKは英単語の読み上げが正直弱いです。ごく一部の単語はちゃんと読み上げてくれますが、基本的にはダメです。しかも読み上げる時にアルファベット読みをするので、文字数の多い英単語が出てくると地獄のような有様になります。TOYAMA POTATO DAISUKI→ティーオーワイエーエムエー ピーオーティーエーティーオー ディーエーアイエスユーケーアイ です。勘弁してくれ
Softalkの場合は有志作成の英語辞書をインポートすることでかなり広い単語に対応することができます。これはマジで優秀。ただ、VOICEPEAKはそうもいかないので、ある程度手作業で単語登録をする必要があります。(記事公開現在)
自分がよく読む記事で頻出する単語は登録していけばいいのですが(WEB→ウェブ、など)流石に手作業で英単語を網羅することはできません。
そこで私が講じた対策がこれ。アルファベットに短い読みを登録することです。
五十音も登録した
こうすることで、長い英単語を強引にローマ字読みさせて時間を短縮しています。当然英単語の本来の読み方とは違うのですが、読み上げで聴いているとなんとなく何を指しているのか分かるようになってきます。何の能力?
例えば「note」は「のて」と読み上げるわけですが、これでもなんか話の流れとかで大体わかる。わかります。分からないものもあるけど(造語のアーティスト名とか)。Youtubeをようつべと呼ぶようなものです。私のVOICEPEAKも勿論ようつべ派です。
現状これであまり困っていません。まあ英単語正確に読んでくれるのに越したことはないんですが。
それ以外だと、自分しか使わないような単語(俺屍自一族など)も登録してます。自分で書いた文章の読み返し(聴き返し?)にも使うので。
書いた文章の読み返しに音声読み上げ、いいですよ。細かい文法や文章の違和などは目で読まないと判断しにくいですが、てにをは間違いや誤字脱字なんかは音声で流す方が発見しやすい時もあります。音抜けてね?ってなるから(漢字や英語の綴り間違いなんかは当然無理ですが)
音声データをスマホに送る
自分はGoogleDriveを使っています。書き出したデータをドライブにアップし、スマホ側で開けばオッケー。
Wifi環境下で開いておけば、外にいる時にギガを使わなくても大丈夫です。これがけっこうデカいんですよね~。私は今通信料ケチってるので…外Youtubeとかはマジで無理なので(ラジコですらけっこう食う)
多分他にも色々方法はあると思います。
改行・空白を削除する
ここからはWEB上の読み物をコピペしてきた時にちょいちょい発生する問題の解決関連
WEBの文章って本当に様々なので、コピペしてきただけの状態だとかなり聞きにくい場合があります。例として、改行を多用するブログなどがそうですね。
改行を多用するブログとは
このような感じで
文章の途中でたくさん改行をして
1行の文字数を少なくしている
スタイルの記事です。
携帯サイトや芸能人ブログの
イメージが強いですが
noteとかでもけっこう見ます。
このタイプの文章をそのまま音声ソフトにつっこむと、改行のところでいちいち間が発生して非常にイライラしてしまいます。これは『音声で聴きたい』という個人的・特殊な状況なので書き手の方に非は無いです。こちらで解決しましょう。
改行や空白を削除してくれるWEBツール。た、たすかる~~!
改行多用ブログは一旦こちらにコピペして改行を削除しちゃいます。
他、PDFの文章をコピペしたい時なども役に立ちますね。
極悪クソALTをこの世から滅ぼせ
過激な見出しになってしまいました。憎んでいるので…極悪ALTを
ALTというのは画像の代替テキストのことで、画像が表示されない時に代わりに表示されるやつです。また、目の見えない方がスクリーンリーダーを使用する際にも、画像の代わりにALT情報が読み上げられます。
そういう性質ですので、『その画像がなんなのか』を分かりやすく入力しておくことが推奨されています。
例えば、この画像と文章をコピペしたとしたら
ALTに設定した文章がこう、なります。
ちなみに私は流石にブログ全部の画像にALTを設定はしてません。まあ個人の趣味の範囲なので…ゆるして!一応サイトトップなんかはALT設定したりはしてます。
ちなみに、ALTを設定していない場合は何も読み上げられません。
このALTの使い方を著しく誤っているメディアがたまにあります。なあ!!ファミ通.comさんよ!!!!!!!(名指し)
インタビュー記事などに添付されている画像のALTがですね…全て記事タイトルになっているんですよね。
例えばこの記事の場合だと、全ての画像のALTに「ポケモンバトルに特化したAI”ポケモンバトルスコープ”開発陣インタビュー。”ポケモン竜王戦2024″のゲーム部門で初導入されたAIの評価法や今後の展望について訊いた」と記入されています。
これをそのまま読み上げさせると、画像が挟まれば「ポケモンバトルに特化したAI”ポケモンバトルスコープ”開発陣インタビュー。”ポケモン竜王戦2024″のゲーム部門で初導入されたAIの評価法や今後の展望について訊いた」と読み上げられ、画像が連続しようものなら「ポケモンバトルに特化したAI”ポケモンバトルスコープ”開発陣インタビュー。”ポケモン竜王戦2024″のゲーム部門で初導入されたAIの評価法や今後の展望について訊いた ポケモンバトルに特化したAI”ポケモンバトルスコープ”開発陣インタビュー。”ポケモン竜王戦2024″のゲーム部門で初導入されたAIの評価法や今後の展望について訊いた」と読み上げられます。
クソ~~~~~~~~~~~~~~~~~~~~~ゆるせね~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~!!!!!!!!!!!ゆるせね~~~~~~~~~~~~~~~~~~~~~~~~~~!!!!!!!!!!!滅んでほしい~~~~~~~~~~~~~~~~~~!!!!!!このタイプのメディア~~~~~~~~~~~~~!!!!!!!
ていうかまあ私はネット上の文章をコピペして読み上げソフトでラジオにしている、という特殊な立場の読者なのであまり文句は言えないと思うんですが、普通にアクセシビリティ的にクソですよ。このタイプの記事、スクリーンリーダーを使っている目の不自由な方ってどうしてるんだろう……?
企業HPなんかはそういうのちゃんとしましょうね、みたいなのがあると思うんですが、この手のウェブメディアは未だに……けっこうある……
ファミ通.comの記事でもこのALTになってないものもあるので、ライターによって違うのか?わからないですが、ファミ通.comに非常に多いです。このタイプの極悪ALT
ゲームメディアの長文インタビューとかを読みたい時ってけっこうあるので、非常に困ります。
というわけで、読み上げ用テキストを作るときはこういうツールで極悪ALT部分を削除します。
ありがとう、ツールを作っている人
画像から文字を抽出
Twitterとかでたまに見る、メモ帳長文お気持ちスクショ。稀に超超長文なこともある。誰が読むんだと思いつつ、内容がちょっと気になる。でも読むのに時間を取りたいとは思わない……そんな時は文字抽出を使います。
便利ねえ。
まあここまでして読みたい長文スクショってそんなに無いんだけども。極稀に使います。
漢数字変換
これもあまり使わないんですが、まれに使うのでメモ
【五六〇年】←これはゴヒャクロクジュウネンと読むわけですが、ソフトによっては上手く読んでくれません。私が使ってるVOICEPEAKはそうです。ゴーロクレーネンと読みます。
これが地味に厄介で、年号とかが頭に入らなくなっちゃうんですよね。ケタが大きくなると更に。
なので、漢数字が出てくる場合は一旦これに突っ込んで変換します
探せばなんでもあるな。ウェブ上の変ツール。
使ってるのはこんな感じだろうか。他にも一応、右クリできないタイプのサイトとかも実はなんとかなったりするんですけど、流石に詳細をアレするのはやめておきます。マジで個人利用の範囲でね!
なかなか文字を読めない情けなき現代人なので、音声読み上げにはとても助けられています。インターネットには無限に長文が漂っていますからね。読み上げても読み上げても果てがありません。すっごい知見の得られる雑学テキストから、テキストサイト時代の化石文書、全然知らないオタクがひたすら感情を吐露しているnoteまで、いっぱい摂取できる。画像メインのネタ記事とかは当然無理だけど(オモコロとか)
遠出する時とか、荷物を準備するノリで合成音声データ用意してますからね私は。前にウォーキングに行った時は3時間以上分の音声データを用意したんだけど、途中で聴き切ってしまいました。
大量に音声情報を脳に入れて記憶に残るのはマジでマジで一部だと思うんですけど、歩いてる時の脳がヒマな感じを潰せればそれでよいのであります。ありがとう、小春六花
あと散歩中に音声聴くのは骨伝導イヤホンがかなりよいです。今年買ってよかったものに確実に入る