最新LLM・モデル
MicrosoftがAI競合に対抗し、3つの新しい基盤モデルをリリース
TechCrunch AI公開: 2026年4月2日(考察: 2026年4月3日)
この記事のポイント
- 12.5倍高速な音声文字起こしや、1秒で60秒分の音声を生成する驚異のスピード
- 2カスタムボイス作成やビデオ生成に対応し、クリエイティブ制作のコストを大幅削減
- 3GoogleやOpenAIよりも安価な価格設定で、個人や小規模ビジネスでも導入しやすい
要約
Microsoft AIは、音声・画像・テキストを生成できる3つの新しい基盤モデルをリリースしました。音声転送モデル「MAI-Transcribe-1」は25言語に対応し、従来のAzure高速版より2.5倍高速化。音声生成モデル「MAI-Voice-1」は、わずか1秒で60秒分の音声を生成でき、カスタムボイスの作成も可能です。画像・ビデオ生成モデル「MAI-Image-2」も公開されました。これらのモデルはムスタファ・スレイマンCEO率いる「Humanist AI」チームが開発し、人間中心の使い勝手を重視。最大の特徴は競合他社よりも安価な価格設定で、MAI-Transcribe-1は1時間あたり0.36ドルから利用可能。現在、Microsoft FoundryやMAI Playgroundで一般公開されています。
出典:TechCrunch AI の情報をもとにAIが要約
当サイトの考察
“
ヒナキラです!MicrosoftがOpenAIとの提携を維持しつつ、独自の「MAI」ブランドで自社製モデルを揃えてきたのは非常に戦略的です。注目は「爆速」と「低コスト」の両立。先週、Googleが低価格な動画生成「Veo 3.1 Lite」を出したとお伝えしましたが、Microsoftもそれに応酬するように、極めて安価な音声・動画モデルを投入してきました。特に「1秒で60秒の音声を生成」というスピードは、リアルタイムの翻訳や、大量の動画ナレーション作成を行うクリエイターにとって夢のようなスペックです。これまで「AI活用はコストが心配……」と二の足を踏んでいた副業者にとっても、この価格破壊は追い風ですね。Microsoftの既存製品(OfficeやWindows)にこれらが直接組み込まれるようになれば、私たちの日常作業はさらに「AI任せ」が当たり前になっていくでしょう。
よくある質問
QMAI-Voice-1で自分の声を作れますか?
A
はい。カスタムボイス作成機能があるため、自分の声を学習させてナレーションを自動生成させることが可能です。
Q価格はどれくらい安いのですか?
A
文字起こしが1時間あたり約50円、音声生成が100万文字あたり約3,400円など、他社の有力モデルに比べ競争力のある価格です。
Qどこで試すことができますか?
A
「MAI Playground」というウェブ上のテスト環境で、実際にモデルの性能を試すことができます。
用語解説
基盤モデル
膨大なデータで学習され、翻訳、文章作成、画像生成など幅広いタスクに応用できるAIの土台。
カスタムボイス
特定の個人の声をAIに学習させ、その人の話し方や声質を再現した合成音声。
Foundry
Microsoftが提供する、開発者が新しいAIモデルを試したり構築したりするためのプラットフォーム。
※ この記事の要約・考察・FAQ・用語解説はAIによって生成されています。正確な情報は元記事をご確認ください。

ヒナキラ
Hinakira AI News 編集長
AIツール・LLM・プロンプト活用術を中心に、個人クリエイター・副業者向けのAI最新情報を毎日お届けしています。AI歴3年以上、いろんな用途に実際に使って試してきた知見をもとに、読者が「自分ごと」として活用できる考察を心がけています。
