iOS 11 には、機械学習と人工知能の最新の技術を活用して、話す際のイントネーション、ピッチ、強調、テンポを調整する、より自然で表現力豊かな Siri 用の男性と女性の合成音声が含まれています。
Apple の機械学習ブログの投稿の下部にある音声スニペットでは、iOS 9、10、11 と、iOS の新しいメジャーリリースごとに Siri の音声がどのように変化してきたかが強調されています。当社の Andrew O'Hara が、長年にわたり Siri の音声がどのように進化してきたかを確認できる短いビデオを作成しました。
YouTubeでiDownloadBlogを購読する
Appleはここ数年、Siriの音声を間違いなく改善してきました。
iOS 11 の新しい音声の抑揚は本当に素敵に聞こえますが、やや一般的なフレーズの間違った単語を強調する場合があります。
それでも、Siri は現在機械学習と人工知能を使用しているため、Apple が時間とともに進歩するにつれて、新しい音声はさらに良くなるでしょう。
以下は Apple の機械学習ブログからの抜粋です。
iOS 11では、Siriの声の自然さ、個性、表現力を向上させることを目指し、新しい女性声優を採用しました。数百人の候補者を評価した上で、最適な声優を選出しました。その後、20時間以上の音声を録音し、新しいディープラーニングベースのTTS技術を用いて新しいTTS音声を構築しました。その結果、新しいアメリカ英語のSiriの音声は、これまで以上に優れた音質を実現しました。
iOS 9 と iOS 10 はどちらも Siri の音声に大きな改善が見られましたが、iOS 11 では文章のつながりや抑揚がより良くなり、大きな前進を遂げたと思いませんか?