【シリコンバレー時事】米グーグルは6日、文章や画像を自動で作る生成AI(人工知能)の基盤技術「Gemini(ジェミニ)」を投入すると発表した。 【写真】グーグルのイベントに登壇したピチャイ最高経営責任者(CEO) テキストや画像、音声など幅広いデータを学習し、理解と回答の能力を高めた。最高性能の「ウルトラ」は、先行する対話型AI、チャットGPTの基盤技術「GPT―4」を多くの面でしのいだとアピール、巻き返しを図る。 ウルトラの他、広範な課題をこなす「プロ」、スマートフォンなどでも効率的に動く「ナノ」を展開。プロは自社の対話型AI「バード」に搭載し、6日から無料で170以上の国・地域で利用できる。当初は英語のテキストのみに対応し、順次言語や機能を拡充する。 ナノはグーグルの最新スマホ「ピクセル8プロ」向けに提供。録音の要約などに使えるようにする。対応端末は今後増やす方針だ。一方、ウルトラは対象を絞って提供後、来年初めに公開する。 ジェミニは、検索や業務用ソフトウエアに対象範囲を広げるとともに、開発者やクラウドの顧客企業も活用できるようにする。 利用イメージを示した動画では、紙に描かれた鳥をスマホのカメラで写すと、ジェミニが「鳥」と回答。水面に浮かぶ様子を付け足すと、「カモだ」と答える様子が披露された。英語以外では何と呼ぶかを尋ねると、日本語や中国語の表記を示した。 ウルトラは32の技術指標のうち30で、米オープンAIのGPT―4を上回った。文書に加え動画や静止画、音声も扱える「マルチモーダル」も売りだ。グーグルは、オープンAIと提携してクラウド事業を拡大するマイクロソフト(MS)に後れを取っているとの見方を払拭したい考えだ。 グーグルのピチャイ最高経営責任者(CEO)は声明で「この新時代のモデルは、われわれの最大級の科学と技術力を表すものだ」と胸を張った。