ジャンル名程度の短い入力でも、AIがプロンプトを自動補完して高品質な曲を生成
SunoにはSunoには「音楽に詳しくない人でも高品質な曲を作れる」Simpleモードが用意されています。このモードの内部にはプロンプト自動補完の仕組みが組み込まれており、ジャンル名や雰囲気を表す短い日本語を入れるだけで、AIが音楽理論に沿った詳細な英語プロンプトに自動拡張して曲を生成します。
Styles欄でサンプルとして提示されていたタグを順に押して入力された「かわいい女性の声, 男性ボーカリスト, 劇的な盛り上がり」という日本語プロンプトで生成してみたところ、Sunoは内部で「Japanese pop ballad with dramatic lift, mid-tempo sway, piano-led verses and a half-time pre-chorus; verse stays intimate with sparse piano and brushed percussion, chorus opens into wide strings and tom fills, Male lead carries the verses with soft breathy doubles, a cute female harmony answers key hook lines and joins in stacked thirds on the chorus, Glimmering bell accents, rising reverse swells, and a final key-change feel give the last chorus a big emotional surge, Bright, polished, cinematic mix with close-mic vocals and glossy low end」という編成・構成・ミックス感まで記述した長文英語プロンプトに拡張して処理していました。「男性ボーカリスト」と「かわいい女性の声」という矛盾する指定も、男性リード+女性ハーモニーのデュエット解釈で両立させてくれます。Geminiで同じような二層構造の指示(「明るいけど切ない」等)を試したときには片方だけ拾うか混乱する挙動がありましたが、Sunoは両立方向に解釈する設計の違いがあります。
出来上がった曲は意図して調整していない状態としては非常に高品質で、これから曲作りをどんどんやっていきたいという意欲が湧く仕上がりでした。音楽用語を知らなくても、思いつきの短い言葉から商業レベルに近いクオリティの曲が出てくるのがSimpleモードの強みです。
SunoのSimpleモード。短い日本語プロンプトを入力するだけで内部で英訳・拡張される
「かわいい女性の声, 男性ボーカリスト, 劇的な盛り上がり」での生成曲
チュートリアルでジャンルなどを入れて最初に生成された曲
鼻歌で思いついたメロディから作曲できるRecord機能
SunoにはAudio入力として「Browse(既存の生成曲を参照してRemix)」「Upload(手持ちの音源をアップロード、最大8分)」「Record(その場で録音)」の3方式が用意されており、なかでもRecord機能は楽器も楽譜も音楽理論の知識もない人でも作曲できる独自の導線になっています。GeminiやElevenLabsには同等の機能がないため、Sunoがアマチュア層に深く浸透している理由の一端はここにありそうです。
ただし、他人の楽曲をそのまま取り込んで編曲するような使い方はできません。試しに有名曲の冒頭リフを鼻歌で吹き込んでみたところ、「Uploaded audio contains copyrighted lyrics. Please upload a different audio file.」というエラーメッセージが出て生成が弾かれました。メロディだけを入れたのにエラー文言が「lyrics」になっている点が興味深く、Sunoはメロディパターンから既知楽曲を照合する著作権フィルタを持っており、ヒット時には内部的にその楽曲の歌詞情報と紐づけて表示している設計のようです。2025年にSunoがWarner Music Groupと和解・ライセンス契約に至った経緯を考えると、この厳格なフィルタリングは今後も強化される方向と見られます。Record機能は「自作オリジナルメロディ」の入力を前提にした設計のようです。
スマホアプリでの録音画面。録音はブラウザでも可能。
有名楽曲のメロディを入力したときに表示される著作権フィルタのエラー
1プロンプトで4曲生成、チャレンジクリアで無料クレジットを実質最大6倍に拡張
Sunoは無料プランでも毎日50クレジットが付与され、これは10曲分に相当します。私が実際に試したところ、1プロンプト入力で消費されるのは10クレジットですが、出てくる曲は実質4曲でした。内訳はv4.5-allモデルのフル尺が2曲、v5.5 Previewモデルの1分尺が2曲。つまり無料プランで使えるv4.5-allの曲に加えて、最上位モデルのv5.5 Previewまでセットで付いてくる構造です。音質比較ができるだけでなく、「v5.5の音はいいな」と体感させて有料プランへの誘導圧をかけ続ける設計にもなっていて、フリーミアムの仕掛けとしてもよくできています。
さらに、Challenges機能で無料枠を大きく拡張できます。「Create 10 songs」「Share a song」「Create a playlist」「Publish a song」など5つのチャレンジを24時間以内にクリアすることで、各+50クレジット、合計最大+250クレジット/日まで追加で獲得できます。通常の50クレジットと合わせて最大300クレジット/日となるため、初日にチャレンジをクリアすれば最大で60曲生成できる計算になります。本気で大量に曲を作らない限りは無料プランでもかなり使えるボリュームです。
なお、生成した曲は無料プランでもMP3形式でダウンロードが可能です(WAV形式やVideo形式のダウンロードはPro以上)。ElevenLabsが無料プランではダウンロード自体が不可なのと比べると、無料プランの実用性の差は大きいです。ただし、ダウンロードしようとすると「Need commercial rights? Only Pro and Premier songs are eligible for commercial use.」という注意喚起のポップアップが表示されます。Download Anywayを押せば無料でもダウンロード自体は完了しますが、無料プランでダウンロードした楽曲は商用利用不可という制約が明示されており、SNS投稿や動画のBGMとして使うには原則Pro以上のプランへのアップグレードが必要です。
5つのチャレンジを24時間以内にクリアで無料クレジットが最大+250/日加算される
ダウンロード時に表示される商用利用確認ポップアップ。無料プランで作った曲は商用利用不可
初心者向けに最適化されたスマホアプリ
Sunoのスマホアプリ版は、ブラウザ版の機能を削ぎ落とした縮小版ではなく、初心者が快適に使えるように最適化された独自設計になっています。ブラウザ版のUIは英語固定で言語設定が存在しないのに対し、アプリ版のUIは日本語表記で、メニューも「単純/高度な」「スタイル」「声の性別」「奇妙さ」「スタイルの影響」といった日本語で表示されます。
さらに、生成体験そのものの感覚がアプリ版の方が快適です。ブラウザ版では曲の生成が完了してから再生可能になるのに対し、アプリ版ではプログレッシブ再生が採用されており、生成が始まると14秒から23秒程度ですぐに再生ボタンが押せる状態になります。実際にアプリ版で3:16の曲を生成したとき、再生可能になったのは開始14秒後でしたが、再生中最初は曲の秒数が表示されず(生成中の状態)、生成開始から1分43秒経ったタイミングで3:16と表示(生成完了)されました。バックエンドの生成時間自体はブラウザ版と同じですが、「できるまで待つ」ではなく「聴きながらできあがる」体験になるため、体感速度は大きく違います。作成した曲をそのままプレイリストとして聴ける点も、スマホアプリ的な使い方に馴染みます。
おまけに、ブラウザ版ではプロプランでないと触れないAdvanced Slidersの「奇妙さ」「スタイルの影響」も、アプリ版では無料プランでも操作可能な状態になっていました。意図的なプラットフォーム別設計なのか、アプリ版への制限反映漏れなのかは不明ですが、少なくとも本記事執筆時点では、無料プランでAdvanced Slidersを動かしたいユーザーはアプリ版を使う選択肢があります(仕様変更される可能性があるので恒久的な運用には向きません)。初心者がSunoを始めるなら、ブラウザ版よりアプリ版から入るのが圧倒的に快適というのが実感です。
スマホアプリ版はUIが日本語、無料プランでも奇妙さ・スタイルの影響スライダーが操作可能
歌詞・音・ボーカルの制御責務が明確に分業されたAdvancedモードで、本格的な詳細カスタマイズに対応
本格的に作り込みたいクリエイターに対しては、Advancedモードが用意されています。Sunoの優れている点は、このモードでの制御責務がUIレベルできれいに分業されていることです。歌詞を入力する「Lyrics欄」は「何を」「いつ」「どの言語で」歌うかを担当し、音楽スタイルを記述する「Styles欄」は「どういう音で」鳴らすかを担当します。さらにMore Options配下に「声の性別(Male/Female)」「Lyrics Mode(Manual/Auto)」「Lyrics Model(Classic/ReMi Beta)」「奇妙さ」「スタイルの影響」という細かい制御項目が並び、合計で4軸スライダー+2つのトグル+1つのモデル選択という多層制御ができます。
この責務分業は実際にテストして確認しました。たとえば曲の言語指定はStyles欄にいくら「イタリア語のラップ」と書いても無視されて、プロンプト全体の言語で歌われてしまいます。一方、Lyrics欄にイタリア語の歌詞を直接入れると、ちゃんとイタリア語で歌ってくれます。曲の尺についても同じで、Styles欄にプロンプトとして「Song duration: 3 minutes.」と明示しても無視され、結果として47秒や1分4秒といった短い曲が出てきます。一方で、9セクション分のフル尺歌詞をLyrics欄のManualモードで入れたところ、3:16や2:34の長尺曲が生成されました。Sunoは尺指定UIを持たない代わりに、Lyrics欄の文字量で尺を制御する設計です。この「どの制御をどこでやればいいか」が明確なので、Advancedモードは触れば触るほど意図通りの曲が作れるようになります。
ただし、詳細な音楽指示を反映させたい場合は、プロンプトを英文で書く必要があります。実際に、自分の好みに合わせた詳細指示(600字超、BPM150以上のイタリア語高速ラップ、スラップベースのグルーヴ、ジャズコード進行、ゴーストノート多めのテクニカルなベースライン、ブリッジミュートとゴーストノートを活かしたギターリフ、低めのダミ声、ブレイク、ディストーション等)を日本語のままAdvancedに入れたところ、内部では「alternative funk rock, rap (fast/Italian tongue-twister), trap-influenced drums」という3要素だけに圧縮されてしまい、ほとんどの指示が消失しました。ところが同じ内容を英語(Energetic alternative funk rock with Italian rap vocals, BPM 150+, slap bass groove with ghost notes and syncopation, bridge-muted guitar riffs with jazzy chord progressions...)で書き直して入れ直すと、本場のイタリア語発音に近いラップ、低いダミ声のダークでセクシーなトーン、ブリッジミュートのギターリフ、ローファイな音質まで、指示がほぼそのまま反映された曲が生成されました。Sunoを本格的に使うなら、Claude・ChatGPT・Geminiといった他のAIと作りたい曲を壁打ちして英文プロンプトを作り、それをSunoに投入するというワークフローが実質必須になります。Suno単体で使うツールというより、AI群と組み合わせて使うツールと捉える方が正確です。
さらに、Pro以上のプランでは生成後の本格編集が可能なSong Editor、Premierプランでは完全なDAW風ワークスペースのSuno Studioが用意されており、セクション単位の編集やステム分離、ミックス調整、アレンジ変更などができるようになります。これらは本検証ではFreeプランのため実機確認できていませんが、無料プランで生成まで試したうえで、本格的に作り込みたくなったら有料プランに移行するという段階的な使い方が想定されています。
AdvancedモードのLyrics欄・Styles欄。歌詞とスタイル記述で責務が分業されている
More Options配下の制御項目。声の性別・歌詞モード・奇妙さ・スタイルの影響をスライダーやトグルで制御できる
利用前に知っておきたいこと
Sunoを本格的に使ううえで、いくつか注意点があります。
まず前述の通り、**日本語プロンプトのままAdvancedモードで詳細指示を書いても、大半の情報が内部の英訳処理で失われます**。Advancedで詳細制御したい場合は、ClaudeやChatGPTなどのAIアシスタントに「こういう曲を作りたい」と壁打ちして英文プロンプトを作成してもらい、それをSunoに投入するという二段構えのワークフローが実質必須です。Sunoを単独で使おうとせず、AI群と組み合わせるツールとして捉える必要があります。
次に、**曲の尺を指定するUIが用意されていません**。ElevenLabsでは「30秒/1分/2分/4分/6分/カスタム」のように尺を直接指定できますが、Sunoは尺指定UIを持たず、プロンプトに「Song duration: 3 minutes.」と書いても無視されます。唯一の制御手段はLyrics欄の歌詞量で、長尺が欲しければLyrics Manualモードでフル尺分の歌詞を自分で用意する必要があります。歌詞を細かく書き込む手間はありますが、逆に言えば曲の構造を自分で設計したい本格派には向いています。
3点目は音質の方向性です。**最新モデルのv5.5は「スタジオマスタリング済み・放送品質」方向に振り切った音質**で、ポップ・バラード・シネマティックといったジャンルでは高い表現力を発揮しますが、Lo-fiヒップホップやガレージロック、アンビエントの意図的な粗さが重要なジャンルでは、機械的に滑らかな高音域がむしろジャンル感を損なう場合があります。私はロック系の楽曲ではあえてLo-fiを指定する方なので、v5.5の音質は逆に過剰に感じました。用途やジャンルに応じてv4.5-all(無料)とv5/v5.5(有料)を使い分ける運用が実務的です。
最後に、**ブラウザ版のUIは英語固定で、アカウントメニューのどこにも言語切替設定がありません**。日本語UIで使いたい場合はスマホアプリ版を使うか、Chromeの翻訳機能を併用する必要があります。プロンプト入力自体は日本語でも通るため、英語表記が気にならなければブラウザ版での制作も問題なく可能ですが、初心者が最初に触るならアプリ版から入るのが無難です。