最新LLM・モデル

MicrosoftがAI競合に対抗し、3つの新しい基盤モデルをリリース

TechCrunch AI公開: 2026年4月2日(考察: 2026年4月3日)

この記事のポイント

12.5倍高速な音声文字起こしや、1秒で60秒分の音声を生成する驚異のスピード
2カスタムボイス作成やビデオ生成に対応し、クリエイティブ制作のコストを大幅削減
3GoogleやOpenAIよりも安価な価格設定で、個人や小規模ビジネスでも導入しやすい

要約

Microsoft AIは、音声・画像・テキストを生成できる3つの新しい基盤モデルをリリースしました。音声転送モデル「MAI-Transcribe-1」は25言語に対応し、従来のAzure高速版より2.5倍高速化。音声生成モデル「MAI-Voice-1」は、わずか1秒で60秒分の音声を生成でき、カスタムボイスの作成も可能です。画像・ビデオ生成モデル「MAI-Image-2」も公開されました。これらのモデルはムスタファ・スレイマンCEO率いる「Humanist AI」チームが開発し、人間中心の使い勝手を重視。最大の特徴は競合他社よりも安価な価格設定で、MAI-Transcribe-1は1時間あたり0.36ドルから利用可能。現在、Microsoft FoundryやMAI Playgroundで一般公開されています。

出典：TechCrunch AI の情報をもとにAIが要約

当サイトの考察

“

ヒナキラです！MicrosoftがOpenAIとの提携を維持しつつ、独自の「MAI」ブランドで自社製モデルを揃えてきたのは非常に戦略的です。注目は「爆速」と「低コスト」の両立。先週、Googleが低価格な動画生成「Veo 3.1 Lite」を出したとお伝えしましたが、Microsoftもそれに応酬するように、極めて安価な音声・動画モデルを投入してきました。特に「1秒で60秒の音声を生成」というスピードは、リアルタイムの翻訳や、大量の動画ナレーション作成を行うクリエイターにとって夢のようなスペックです。これまで「AI活用はコストが心配……」と二の足を踏んでいた副業者にとっても、この価格破壊は追い風ですね。Microsoftの既存製品（OfficeやWindows）にこれらが直接組み込まれるようになれば、私たちの日常作業はさらに「AI任せ」が当たり前になっていくでしょう。

よくある質問

QMAI-Voice-1で自分の声を作れますか？

はい。カスタムボイス作成機能があるため、自分の声を学習させてナレーションを自動生成させることが可能です。

Q価格はどれくらい安いのですか？

文字起こしが1時間あたり約50円、音声生成が100万文字あたり約3,400円など、他社の有力モデルに比べ競争力のある価格です。

Qどこで試すことができますか？

「MAI Playground」というウェブ上のテスト環境で、実際にモデルの性能を試すことができます。

用語解説

基盤モデル

膨大なデータで学習され、翻訳、文章作成、画像生成など幅広いタスクに応用できるAIの土台。

カスタムボイス

特定の個人の声をAIに学習させ、その人の話し方や声質を再現した合成音声。

Foundry

Microsoftが提供する、開発者が新しいAIモデルを試したり構築したりするためのプラットフォーム。

元記事を読む

※ この記事の要約・考察・FAQ・用語解説はAIによって生成されています。正確な情報は元記事をご確認ください。

この記事をシェアする

Post Share Bookmark LINE Threads

ヒナキラ

Hinakira AI News 編集長

AIツール・LLM・プロンプト活用術を中心に、個人クリエイター・副業者向けのAI最新情報を毎日お届けしています。AI歴3年以上、いろんな用途に実際に使って試してきた知見をもとに、読者が「自分ごと」として活用できる考察を心がけています。

ヒナキラのSNSアカウント

@hinakira_gpts hinakira_gpts_creator hinakira_gpts_creator

HinakiraAI News