ドラえもんの「ひみつ道具」はざっと約1600種類ある。いくつかはAIなどデジタル技術の進化によって「完成」が見えてきた。今から3年以内、2022年までに実現しそうな5つのひみつ道具を紹介しよう。

きれいな文章、誰でもすらすら
もはん手紙ペン(深層学習、ニューラルネットワーク)

 このペンを持つだけで、書きたいことをきれいな文章にしてくれる‐‐。ドラえもんのひみつ道具「もはん手紙ペン」を地で行くようなAI人工知能)技術の開発が急ピッチで進んでいる。

 ドラえもんのもはん手紙ペンは、何も考えなくても書きたいことをすらすら書けてしまう道具だ。「年齢目もり」を使えば年齢にふさわしい表現で書いてもらえる。

もはん手紙ペン
(出所:©藤子プロ・小学館)
[画像のクリックで拡大表示]

 琴線に触れるような感動的な文章を書くこともできる。漫画ではのび太がペンで書いた手紙を読んだドラえもんが「こ、こんなにも心をうつ感動的な手紙ははじめてだ」と泣いてしまったシーンもあった。

 もちろん現時点では「もはん手紙ペン」を完全に実現できる技術は存在しない。だが深層学習ディープラーニング)の研究が進むにつれてテキスト生成の技術は急速に進化しており、今後2~3年で実用域に至る可能性がある。

 文章を作り出す技術は大きく「何を書くか」と「どう書くか」に分けられる。このうち「どう書くか」、いわゆる言語モデルの開発には、統計的機械学習と呼ばれる手法を用いていた。膨大な量のテキストを用意して「言語らしさ」をモデルに学ばせるもので、例えば「私はリンゴが」という単語列を言語モデルに入力すると、言語モデルは次にくる可能性が高い単語として「好き」を出力する。

 ただし、従来の統計的機械学習の手法はせいぜい数個前までの単語を基に次の単語を予測するもので、前後の文章から文脈を判断して適切な単語を予測するような、精緻な処理はできなかった。こうした言語モデルの研究が、深層学習の適用によって直近2~3年のうちに飛躍的な進歩を遂げた。

 直近のブレークスルー技術として挙げられるのが、米グーグルが2017年6月に発表した「Transformer」と、同じくグーグルがTransformerの応用技術として2018年10月に発表した「BERT(Bidirectional Encoder Representations from Transformers)」である。

 Transformerは入力した単語列から、文章の意味を理解する上で「注目(Attention)」すべき単語を抽出できるニューラルネットワークだ。そしてBERTはTransformerを複雑に組み合わせた巨大なニューラルネットワークで、予測したい単語の前にある文章だけでなく後ろの文章にも「注目」することで、単語の意味をより正確に捉えることができる。

 BERTが登場したことで「長い文章の文脈を理解し、適切な単語を選んで出力できるようになった」(武蔵野大学データサイエンス学部の中西崇文准教授)という。

図 BERTの構造と事前学習の手法
「穴埋め」問題でAIを鍛える
[画像のクリックで拡大表示]

 文章を処理するニューラルネットワークの前段にBERTを置くことで、文章の意味比較など様々な言語処理タスクを高い精度で実行できるようになった。まず機械翻訳向けに実応用が進み、「プロの翻訳者が書いたような自然なテキストを生成できる」と話題になった。

 AI研究の非営利団体である米OpenAIが2019年2月に開発した「GPT-2」もBERTの発想を取り入れたモデルだ。長い文章を入力すると、文脈を判断して続きの文書を自動生成してくれる。OpenAIは「フェイクニュースの生成に使われかねない」として詳細の公開を取りやめた。

 これらの研究成果を応用すれば、もはん手紙ペンが持つ「年齢目もり」の機能も実現できそうだ。各年齢層ごとの作文データを用意すれば、言語モデルが「子供らしい言い回し」あるいは「大人らしい言い回し」を学習し表現できる。

「何を書くか」にも深層学習を適用

 さらに最近は「どう書くか」に加え「何を書くか」に深層学習を適用する取り組みが進んでいる。

 産業技術総合研究所の高村大也知識情報研究チーム長らの研究チームは2019年6月、バスケットボールの試合データから観戦記事を自動出力する技術の論文を発表した。

 「どのプレーヤーがいつ得点したか」などのデータをニューラルネットワークに読み込ませ、そのニューラルネットワークが別のニューラルネットワーク(言語モデル)に「何を書くか」を指示することで、自然な文体の要約記事を出力する。

 同じように文章のストーリー構造をデータとして表現できれば、スポーツ記事に限らず企業の新製品紹介など、様々なタイプの文章を出力できそうだ。

 では、もはん手紙ペンが持つ「人を感動させるストーリーの生成」は実現できるか。最も難しいように思えるが、実はこの分野は古くから研究が進んでいる。1990年代にはドラマのシナリオ作成を支援する「Dramatica」などのソフトが登場。ハリウッド映画の脚本作りに活用されたとされる。古典作品などから「人は何に感動するか」の特徴を抽出し、ソフトウエアに反映したものだ。

 将来は深層学習などを使って「人を感動させる文章」を生成できるようになりそうだ。人の心を動かすテキストを大量に集めてニューラルネットワークに学習させることで「人の感性を反映した文章を生成できるようになる可能性がある」(中西准教授)。

 人々がドラえもんのもはん手紙ペンを使いこなす時代は、意外に早く訪れそうだ。もっとも、私たち記者にとっては強力なライバル出現となりそうだが。

この先は有料会員の登録が必要です。「日経コンピュータ」定期購読者もログインしてお読みいただけます。今なら有料会員(月額プラン)が12月末まで無料!

日経 xTECHには有料記事(有料会員向けまたは定期購読者向け)、無料記事(登録会員向け)、フリー記事(誰でも閲覧可能)があります。有料記事でも、登録会員向け配信期間は登録会員への登録が必要な場合があります。有料会員と登録会員に関するFAQはこちら