こんにちは、そろそろ生成AIから生み出されそうなきーちゃんです。
AI(人工知能)は、私たちの日常生活やビジネスに革命をもたらしています。AIサービスは、自動化、予測、データ分析、自然言語処理などの分野で優れた成果を上げています。ここでは、AIサービスの中から、特に注目すべき18のサービスを紹介します。
この記事の目次
テキスト・プログラミングコード生成AI
ChatGPT
ChatGPTは、OpenAI社が開発した生成AIサービスで、大規模言語モデル(LLM)をベースにテキストベースの対話を生成します。このサービスは、ユーザーの問いかけや要望に対して、インターネット上で収集した学習データを基に、適切な回答や新たな文書を生成する機能を持ちます。
ChatGPTの特徴
ChatGPTの主な特徴は以下の通りです。
1. 質問応答: ユーザーが入力したテキストに基づいて、適切な回答を生成します。例えば、文章やリストを作成したり、計画を立てたり、歴史の出来事や科学的なトピックについての質問に対して、詳細な回答を提供します。
2. 文章生成: ブログ記事や小説、エッセイなどの文章を自動生成します。特定のトピックに関する文章をリクエストすると、適切な内容を生成します。
3. 日本語に完全対応:ChatGPTは日本語にも対応しており、日本語の処理が自然だと感じられることから、国内での人気も高まっています。
ChatGPTは、学習データから学習されたAIモデルであり、大量のテキストデータをもとに言語のパターンや文脈を理解しています。そのため、多様なトピックに対応できる柔軟性があります。
ChatGPTの料金プラン
ChatGPTは無料で利用可能で、有料プランも存在します。無料プランでは、基本的な機能が利用できます。有料プランでは、「GPT-4.0」を利用することができ、料金は月額20ドルです。
ChatGPTの使い方
ChatGPTの使い方は以下の通りです。
1. ChatGPTの公式サイトにアクセス: WebブラウザからChatGPTの公式サイトにアクセスします。
2. 新規アカウントの登録: GoogleアカウントかAppleアカウント、メールアドレスのいずれかで新規登録します。
3. 質問や指示を入力: 自然な言葉で指示を出すだけで、ChatGPTはまるで人間のように考え、様々な業務をサポートしてくれます。
Gemini(旧称:Google Bard)
Gemini(旧称:Google Bard)は、Googleが開発した対話型AIサービスです。Geminiはテキスト生成AIで、言語モデルを用いてテキストを生成するため、多様な文体やトーンでコンテンツを作成できます。学生やクリエイターにとって、創作活動の一環として利用することができます。
Geminiの特徴
Geminiの主な特徴は以下の通りです。
1. テキストから文章生成: ユーザーが入力したテキストに基づいて、文章やリストを作成したり、計画を立てたりできます。詩や物語、歌詞などの文学的なコンテンツの自動生成も可能で、アーティストや作曲家にも活用が見込まれています。
2. 高度な自然言語処理能力: Geminiは、Googleが開発した大規模言語モデルを採用しており、複雑な質問への対応力の向上や返答速度の向上を実現しています。
3. 日本語に完全対応: プロンプト・回答ともに日本語に完全対応しています。
Geminiの料金プラン
Geminiは無料で利用可能です。Googleアカウントを持っているだけでどんな方でも気軽に利用できます。
Geminiの使い方
Geminiの使い方は以下の通りです。
1. Geminiの公式サイトにアクセス: WebブラウザからGeminiの公式サイトにアクセスします。
2. Googleアカウントでログイン: Googleアカウントでログインします。
3. 質問や指示を入力: 自然な言葉で指示を出すだけで、Geminiはまるで人間のように考え、様々な業務をサポートしてくれます。
Claude3
Claude3(クロード・スリー)は、Anthropic社が開発した言語生成AIです。このサービスは、ユーザーが入力したテキストに基づいて、自然な人間らしい文章を生成します。
Claude3の特徴
Claude3の主な特徴は以下の通りです。
1. 3つのモデル
- Claude3は「Haiku」「Sonnet」「Opus」の3つのモデルから構成されています。それぞれのモデルは、処理速度、知識量、得意分野などが異なるため、ご自分の用途に合わせて最適なモデルを選ぶことが可能です。
2. 高度な自然言語処理能力
- Claude3は高度な自然言語処理能力を持ち、難易度の高い問題への正答率が2倍になり、OpenAIやGoogleのAIの性能を上回ったとの情報もありました。
3. マルチモーダルに対応
- Claude3は、テキストはもちろんのこと、画像や音声、動画などの様々な形式のデータを処理できることを意味します。
Claude3の料金プラン
Claude3には、無料プランと有料プランがあります。無料プランでは、「Sonnet」モデルが利用できます。有料プランでは、「Haiku」と「Opus」が利用可能で、料金は月額3,400円です。
Claude3の使い方
Claude3の使い方は以下の通りです。
1. Claude3の公式サイトにアクセス: WebブラウザからClaude3の公式サイトにアクセスします。
2. 新規アカウントの登録: GoogleアカウントかAppleアカウント、メールアドレスのいずれかで新規登録します。
3. 質問や指示を入力: 自然な言葉で指示を出すだけで、Claude3はまるで人間のように考え、様々な業務をサポートしてくれます。
Copilot
Microsoft Copilotは、Microsoftが提供する生成AIアシスタントで、質問への回答や文章の生成のほか、WordやExcel等と連携して仕事を効率化することができます。Microsoftの提携先であるOpenAIのAIモデル「GPT-4」や「DALL-E 3」(ダリ・スリー)を搭載し、文章・画像生成や対話を行うことができます。
Microsoft Copilotの特徴
Microsoft Copilotの主な特徴は以下の通りです。
1. Bingの検索エンジンを搭載: Copilotは、Bingの検索エンジンを搭載しており、Web上の最新情報の検索が可能です。
2. GPT-4を無料で利用可能: Microsoft Copilotでは、ChatGPTの最新モデルであるGPT-4を無料で利用することができます。
3. Word等の各種ワークツールと連携: Microsoft Copilotの有料版は、Word等のMicrosoftが提供する他のワークツールと連携し、文書作成等のタスクを効率化できます。
Microsoft Copilotの料金プラン
Microsoft Copilotの料金と機能について、Copilot、Copilot Pro、Copilot for Microsoft 365の3つのプランごとに比較した内容は以下の通りです。
- Copilot(無料): 探している情報を見つけ、オリジナルのコンテンツを作成し、すばやく作業を完了します。
- Copilot Pro(¥3,200/月): 創造性と生産性を高めます。
- Copilot for Microsoft 365(年払い、 ¥53,964/年): Microsoft 365 Business Standard または Business Premium サブスクリプションを使用して、Copilot を組織に導入します。
Microsoft Copilotの使い方
Microsoft Copilotの使い方は以下の通りです。
1. Microsoft Copilotを起動: Windows 11では、Microsoft Copilotは標準搭載されており、Microsoft Edgeのサイドバー、Windowsの検索ボックス、タスクバー、ショートカットキー「Windows」+「C」から利用可能です。また、Windows 10でも、Microsoft Edge や Google ChromeのブラウザからCopilotを利用することができます。
2. 質問や指示を入力: 自然な言葉で指示を出すだけで、Copilotはまるで人間のように考え、様々な業務をサポートしてくれます。
画像生成AI
Stable Diffusion
Stable Diffusion(ダウンロード版(Web UI/AUTOMATIC1111)、ブラウザ版)は、最先端の技術を駆使した画像生成AIで、ユーザーが入力したテキスト(プロンプト)情報に基づいて簡単に高品質な画像を生成する能力を持っています。このAIは、深層学習と生成モデルを組み合わせることで、創造的かつ多様なビジュアルコンテンツを生み出すことが可能です。
Stable Diffusionの特徴
Stable Diffusionの主な特徴は以下の通りです。
1. テキストから画像生成: ユーザーは作成したい画像のイメージ(例えば、アマゾンのジャングル、高層ビルが建ち並ぶ都会、など)を英単語で区切って入力することで、様々な画像を作成できます。AIがそれに合った画像を生成します。深層学習と生成モデルを組み合わせることで、創造的かつ多様なビジュアルコンテンツを生み出すことが可能です。
2. オープンソース: Stable Diffusionはソースコードや学習済みの機械学習モデルが無償で公開されているため、それを利用したサービスやアプリも多くリリースされています。
3. 商用利用可能: 商用利用も可能であり、クオリティの高い画像を手軽に作成できます。
Stable Diffusionは、画像生成AIの中でもメジャーな存在であり、初心者でも使いやすいツールとして注目されています。
Stable Diffusionの料金プラン
Stable Diffusionはオープンソースソフトウェアですので、基本的にはライセンスに基づいて無料で利用できます。具体的には、Stable DiffusionではCreativeML Open RAIL M Licenseのもと、商用利用・モデル配布等が許可されています。
ローカル環境(無料):無料で使えますが、ハイスペックなパソコンが必要です。
ブラウザ版(無料):無料で使えますが、機能や枚数に制限があります。
ブラウザ版(有料):有料になりますが、環境に関係なくある程度自由に使えます。
Stable Diffusionの使い方
Stable Diffusion(ブラウザ版)の使い方は以下の通りです。
1. Stable Diffusionの公式サイトにアクセス: WebブラウザからStable Diffusionの公式サイトにアクセスします。
2. テキストを入力: テキストを入力し、それを画像に変換します。
3. 画像を生成: 「描く」ボタンをクリックして画像を生成します。
Midjourney
Midjourney(ミッドジャーニー)は、米サンフランシスコにある同名のAI研究所が送り出すAI画像生成サービスの1つです。2022年7月13日にβ版が一般公開されて以降、1,600万ものユーザーを獲得し、Stable Diffusionなどと並んでMidjourneyは画像生成AI分野をけん引する存在となっています。Midjourneyのサービスは、チャットサービス「Discord(ディスコード)」を通じて利用できます。
Midjourneyの特徴
Midjourneyは他の画像生成AIと比べて、アート・創作活動へのリスペクトに富んでいます。その特徴は以下の8点です。
1. チャットアプリのDiscordから使える
2. プロンプトは英語にのみ対応
3. 有料版で生成した画像は商用利用可能
4. 幻想的な画像を生成してくれる
5. ディープフェイク画像対策が施されている
6. 4K画像の生成にも対応
7. 人物の手指・歯並びをリアルに再現してくれる
8. 作風を真似る追加学習(LoRA)が封印されている
Midjourneyの料金プラン
以前は無料でトライアルできたMidjourneyですが、2024年6月現在では有料版のみの提供となっています。使用目的によって選ぶべきプランが変わってくるので、自分の状況に合わせた最適なプランを探してみてください。
- Basic Plan: $10/月 or $96/年
- Standard Plan: $30/月 or $288/年
- Pro Plan: $60/月 or $576/年
- Mega Plan: $120/月 or $1152/年
Midjourneyの使い方
Midjourneyの使い方は以下の通りです。
1. アカウント登録
- Discordにログインし、Midjourney公式サイトにアクセスします。
- 「Join the beta」をクリックして招待を受けると、Midjourneyへの登録が完了します。
2. 画像生成
- Discordのチャットルームに参加します。無料版では「newbies-○○(数字)」のチャットルームを選択します。
- チャットルームで `/imagine` と入力し、その後に生成したいテキストを入力します。
- Midjourneyはテキストを認識して画像を生成してくれます。
3. 画像のブラッシュアップ
- 生成した画像はテキストに基づいて作成されますが、テキストを変更してブラッシュアップできます。
- より自分のイメージに近い画像を生成するために、テキストを追加・編集してみましょう。
4. 画像の高解像度化
- 生成された画像は「U1~U4」のボタンで高解像度化できます。
- ボタンをクリックして高解像度の画像を表示し、保存できます。
SeaArt AI
SeaArt AIは、シンガポールに本社を置くSTAR CLUSTER PTE. LTD.が運営する画像生成AIサービスです。このサービスは、Stable Diffusionをベースに開発されており、高品質な画像生成が可能です。
SeaArt AIの特徴
SeaArt AIの主な特徴は以下の通りです。
1. 日本語入力に対応: ユーザーは日本語で指示を出すことができます。
2. 無料で利用可能: 1日最大200枚の画像生成が可能です(期間限定)。
3. 多様なジャンルに対応: リアルな人物画像、風景、イラスト、絵画風など、多様なジャンルの画像生成に対応しています。
4. 高度な機能も利用可能: コントロールネットやimg2imgなどの高度な機能も利用できます。
SeaArt AIの料金プラン
SeaArt AIには4つの料金プランがあります。
- 初級プラン: $2.39/月 (年間プラン)
- スタンダードプラン: $7.99/月 (年間プラン)
- プロプラン: $23.99/月 (年間プラン)
- マスタープラン: $39.99/月 (年間プラン)
SeaArt AIの使い方
SeaArt AIの使い方は以下の通りです。
1. アカウント登録とログイン: Googleアカウント、Twitterアカウント、Facebookアカウント、メールアドレス、電話番号のいずれかを使って登録できます。
2. 画像生成の基本操作: ログイン後、トップページの「創作」ボタンをクリックすると、画像生成ページに移動します。ここでは、モデル、プロンプト、LoRA、コントロールネット、img2imgなどの要素を組み合わせて画像を生成します。
3. 高度な機能の活用: 初心者でも簡単に利用できる「Easy Mode」と、より詳細な設定が可能な「創作モード」があります。
Adobe Firefly
Adobe Fireflyは、アドビが開発・提供している画像生成AIツールです。シンプルなテキスト入力で美しい画像やカラーパレットなど最高品質の作品を制作することができます。
Adobe Fireflyの特徴
Adobe Fireflyの主な特徴は以下の4つです。
1. 100を超える言語に対応: 日本語を含む100を超える言語に対応しています。
2. 他のAdobe製品との連携: 他のAdobe製品と連携し、画像生成から編集まで一気通貫で可能です。
3. 著作権侵害の心配なし: Adobe Fireflyが学習している画像データはすべて、著作権切れのコンテンツやAdobe自体のコンテンツであるため、Adobe Fireflyで生成した画像を利用しても、著作権侵害の心配がありません。
4. 60億点以上の画像を活用可能: 他のクリエイターによる60億点以上の画像が展示されたオンラインコミュニティが用意されています。
Adobe Fireflyの料金プラン
Adobe Fireflyには無料プランとプレミアムプランがあります。無料プランでは、毎月25枚まで画像を生成することができます。プレミアムプランでは、月額680円で毎月100の生成クレジットを利用でき、Adobe Fireflyによって生成された画像に透かしが入りません。
Adobe Fireflyの使い方
Adobe Fireflyの使い方は以下の通りです。
1. Adobe Fireflyの公式サイトにアクセス: WebブラウザからAdobe Fireflyの公式サイトにアクセスします。
2. ログインまたはアカウント作成: 既存のGoogle、Facebook、Appleのアカウントを用いる方法と、メールアドレスを登録して新しくアカウントを作成する方法があります。
3. プロンプトを入力し画像を生成: 画面中央にあるテキストボックスから、生成したい画像のプロンプトを入力します。
4. 画像の編集・ダウンロード: 生成した画像はそのままダウンロードすることができます。
Dream Studio
Dream Studioは、Stability AI社が開発・運営する画像生成AIサービスです。このサービスは、Stable DiffusionのAI技術を活用しています。
Dream Studioの特徴
Dream Studioの主な特徴は以下の通りです。
1. テキストから画像生成: ユーザーが入力したテキストに基づいて画像を生成します。
2. 高度な設定: 画像のサイズや類似度、処理回数などをユーザーが自由に設定できます。
3. 著作権フリー: 生成された画像の著作権はフリーで、自由に利用が可能です。
4. 多言語対応: 英語表記の画像生成AIですが、Google翻訳を利用すれば問題なく使いこなせます。
Dream Studioの料金プラン
Dream Studioには月額制の料金プランは存在しません。画像生成1枚ごとにクレジットを消費するタイプです。価格は10ドル=1,000クレジットで、10ドル未満での購入はできません。
Dream Studioの使い方
Dream Studioの使い方は以下の通りです。
1. アカウント作成: Googleアカウント、Discordアカウント、メールアドレスのいずれかで新規登録します。
2. スタイルの選択: 生成する画像のスタイルを選択します。
3. プロンプトの入力: 「DreamStudio」で生成する画像のプロンプトを入力します。
4. ネガティブプロンプトの入力: 生成する画像に反映してほしくない要素を追加する際の指示です。
5. イメージ画像のアップロード: 「DreamStudio」では、生成する画像の参考となるイメージ画像をアップロードする機能があります。
6. 解像度の調整: 「DreamStudio」では生成する解像度を調整できます。
7. 生成枚数の変更: 一度に生成する画像の枚数を調整します。
8. 高度設定: 「DreamStudio」には「Advanced」と呼ばれるオプションが用意されています。
9. 画像生成: 「Dream」をクリックし、画像を生成します。
Magic Media(Canva AI)
Magic Media(Canva AI)は、オンラインデザインツール「Canva」が提供するAI画像生成サービスです。このサービスは、ユーザーが入力したテキストから美しい画像を生成します。
Magic Mediaの特徴
Magic Mediaの主な特徴は以下の通りです。
1. テキストから画像生成: ユーザーが入力したテキストに基づいて、イラスト、絵画、写真などあらゆる種類の画像を生成します。
2. 多様なスタイル: 水彩画、映画的、ネオン、色鉛筆、レトロウェーブなどのスタイルオプションを使って、生成した画像にさまざまなモードを試すことができます。
Magic Mediaの料金プラン
Magic Media(Canva AI)の料金プランは以下の通りです。
1. Canva(無料版): このプランは無料で、AI画像生成を月に50回、AI動画生成を5回まで利用できます。
2. Canvaプロ: このプランは年間$120(1名あたり)で、AI画像生成を月に500回利用できます。
3. Canvaチーム: このプランは年間$100(1人あたり、最小3人から)で、AI画像生成を月に500回利用できます。
4. Canvaエンタープライズ: このプランの料金は個別に相談となります。
以上のプランにはそれぞれ特定の機能が含まれており、ユーザーのニーズに応じて選択できます。
Magic Mediaの使い方
Magic Mediaの使い方は以下の通りです。
1. Canvaを開く: Canvaを起動します。
2. 生成AIを使う: 生成AIの機能はCanva docsなら「+」をクリック。デザイン画面からは「/」キーを押して表示させることができます。
3. テキストプロンプトを入力: 「被写界深度のある街中を自転車で走るパンダ」のような単語やフレーズを入力し、それが美しい画像に変換されるのを見ます。
4. 画像スタイルを選択: 創作には、実験がつきものです。目指すコンセプトに合わせて、具体的なスタイルや縦横比を選びます。
音声生成AI
VALL-E
VALL-Eは、Microsoftが開発した音声合成AIモデルです。このサービスは、わずか3秒間の音声サンプルからその人の声を忠実に再現できます。
VALL-Eの特徴
VALL-Eの主な特徴は以下の通りです。
1. 3秒間の音声サンプルから声を再現: VALL-Eは、たった3秒間の音声サンプルからその人の声を忠実に再現できます。
2. 感情の調子を調節: VALL-Eでは、感情の調子を調節したり、録音環境の再現も含んだ合成音声の生成にも対応しています。
3. 音声を圧縮する技術を採用: VALL-Eでは音声を圧縮する技術を採用しており、データを細かい要素に分解することでわずか3秒の音声データから人の声の忠実な再現を実現しています。
4. 膨大な音声データから学習: VALL-Eでは約6万時間分の学習用音声データを用いてAIを訓練しています。
VALL-Eの料金プラン
ライセンス:MIT(商用利用可能)のため無料で利用できるようです。
VALL-Eの使い方
VALL-Eの使い方は以下の通りです。
1. VALL-E Xのセットアップ: WindowsPCにVALL-E Xの環境を構築します。
2. GPU動作環境の確認: GPU動作確認用スクリプトファイル(test.py)を作成し、VALL-E Xフォルダ直下にファイル保存します。
3. VALL-E Xの起動: コマンドプロンプトからVALL-E Xの起動スクリプトを実行します。
4. サンプル AI音声の生成: 画面下部の「Examples」欄から、「ja-2.ogg」の行をダブルクリック選択します。
このサービスを使えば、音声を忠実に再現することができます。
Text-to-Speech AI
Text-to-Speech AIは、テキストを人間の声に変換するAI音声機能です。このサービスは、Googleが提供する高性能音声生成AIツールで、テキストのリアルタイム音声変換や、自然なイントネーションでの出力、多言語生成などさまざまな機能が備わっています。
Text-to-Speech AIの特徴
Text-to-Speech AIの主な特徴は以下の通りです。
1. 自然な響きの音声: 人間の声のイントネーションや感情と一致する、滑らかで自然に聞こえるテキスト読み上げを実現します。
2. カスタマイズ可能なテキスト読み上げ音声: ブランドのアイデンティティを反映する独自のAI音声ジェネレーターを作成します。
3. 微調整した音声読み上げオーディオ: コントロールスピード、声の高さ、発音、間などを簡単に調節し、シナリオに合わせて音声出力を調整できます。
4. 柔軟性の高いデプロイ: クラウド、オンプレミス、コンテナーを使用したエッジで、どこでもText to Speechを実行できます。
Text-to-Speech AIの料金プラン
Text-to-Speech AIの料金は、音声に変換する文字数に基づく従量課金制です。初期コストは不要で、料金は使用した分だけ発生します。
Text-to-Speech AIの使い方
Text-to-Speech AIの使い方は以下の通りです。
1. Text-to-Speech AIを開く: WebブラウザからText-to-Speech AIの公式サイトにアクセスします。
2. テキストを入力: テキストを入力し、それを音声に変換します。
3. 音声を調整: 音声のスピード、声の高さ、発音、間などを調整します。
4. 音声を生成: 生成ボタンをクリックして音声を生成します。
このサービスを使えば、テキストを自然な音声に変換することができます。
音楽生成AI
Suno AI
Suno AIは、テキストから音楽を生成するAIサービスです。このサービスは、音楽制作の知識がなくても、歌詞や曲のイメージを入力するだけで、オリジナルの楽曲を作ることができます。
Suno AIの特徴
Suno AIの主な特徴は以下の通りです。
1. テキストから音楽生成: ユーザーが入力したテキストに基づいて、オリジナルの楽曲を作ることができます。
2. 多様な音楽ジャンルに対応: ポップ、ロック、メタル、ユーロビートなど、多様な音楽ジャンルに対応しています。
3. 日本語の歌詞生成に対応: 英語のみならず日本語での歌詞生成にも対応しています。
4. 無料でも利用可能: Suno AIは無料でも利用でき、クレジットを消費して曲を生成します。
Suno AIの料金プラン
Suno AIには、ユーザーのニーズに合わせた3つの料金プランがあります。
- Basic Plan: 無料で使えるプラン。基本的な機能が利用でき、1日50クレジットが付与される。
- Pro Plan: 月額8ドル。より多くの楽曲生成と高度な編集機能が使えるプラン。
- Premier Plan: 月額24ドル。大量の楽曲生成が可能。
Suno AIの使い方
Suno AIの使い方は以下の通りです。
1. Suno AIの公式サイトにアクセス: WebブラウザからSuno AIの公式サイトにアクセスします。
2. アカウント登録手順: Discord、Google、Microsoftのいずれかのアカウントを使って登録します。
3. 楽曲生成の手順: 「Song Description」に歌詞を入力し、「Create ♫」を選択し、楽曲を生成します。
AIVA
AIVAは、さまざまなAIサービスを提供している企業です。その中でも特に注目されているのが、音楽生成AIサービスとAIバリュエーションサービスです。AIVAの音楽生成AIサービスは、AIを活用して新しい曲を生成することができます。このサービスは、音楽制作の知識がなくても、自動で音楽を作曲してくれます。
AIVAの特徴
AIVAの音楽生成AIサービスの特徴については以下の通りです。
1. AIによる曲生成: AIVAは、250以上の異なるスタイルで新しい曲を生成することができます。初心者からプロまで、誰でも簡単に自分だけの曲を作ることができます。
2. 究極のカスタマイズ性: ユーザーは自分のスタイルモデルを作成したり、オーディオやMIDIの影響をアップロードしたり、生成されたトラックを編集したりすることが可能です。
3. 複数のファイル形式のサポート: 生成された曲は、MP3やMIDIなどの様々なファイル形式でダウンロードすることができます。
4. ライセンスの頭痛からの解放: AIVAを使用して生成された音楽を収益化したい場合、Proプランに登録することで、作曲者は自分の作品の完全な著作権を永久に所有することができます。
5. DAWライクなエディター: 生成されたトラックを視覚的に表示し、編集やミキシングを行うことができます。
6. 高品質なAI生成音楽: AIVAは、さまざまなクリエイティブプロジェクトに適した高品質なAI生成音楽を提供します。
AIVAの料金プラン
AIVAの音楽生成AIサービスの料金プランは以下の通りです。
1. 無料プラン (Free, Forever):
- 月額: €0
- 商用利用: 不可
- AIVAへのクレジット表記: 必要
- ダウンロード可能な曲数: 月に3曲まで
- 曲の最大長さ: 3分まで
- ファイル形式: MP3 & MIDI
2. スタンダードプラン (Standard Annually):
- 月額: €11 (税別、年間契約)
- 商用利用: YouTube, Twitch, TikTok, Instagramでのみ可能
- AIVAへのクレジット表記: 不要
- ダウンロード可能な曲数: 月に15曲まで
- 曲の最大長さ: 5分まで
- ファイル形式: MP3 & MIDI
3. プロプラン (Pro Annually):
- 月額: €33 (税別、年間契約)
- 商用利用: 制限なし
- AIVAへのクレジット表記: 不要
- ダウンロード可能な曲数: 月に300曲まで
- 曲の最大長さ: 5分30秒まで
- ファイル形式: 全ての形式、高品質WAVファイルもエクスポート可能
AIVAの使い方
AIVAの使い方は以下の通りです。
1. AIVAのウェブサイトにアクセスします。
2. 「作曲を開始」をクリックして、新しいプロジェクトを開始します。
3. 生成したい曲のスタイルを選択します。
4. 生成ボタンをクリックして、AIによる曲の生成を開始します。
5. 生成された曲を聴いて、必要に応じて編集や保存を行います。
Music LM
Music LMは、Googleが開発した音楽生成に特化した人工知能(AI)モデルです。このサービスは、さまざまなジャンルの音楽を自動的に作成することができます。
Music LMの特徴
Music LMの主な特徴は以下の通りです。
1. テキストから音楽生成: ユーザーが入力したテキストに基づいて、オリジナルの楽曲を作ることができます。
2. 多様な音楽ジャンルに対応: ポップ、ロック、メタル、ユーロビートなど、多様な音楽ジャンルに対応しています。
3. 高品質な音楽生成: Music LMはのべ28万時間分もの音楽で構成されたデータセットでトレーニングしており、テキストの内容にふさわしい音楽を生成できます。
Music LMの料金プラン
現在のところ無料で利用できるようです。
Music LMの使い方
Music LMの使い方は以下の通りです。
1.テキスト記述を入力します。例えば、「落ち着いたバイオリンのメロディに歪んだギターリフがバックアップする」など。
2.モデルは入力されたテキスト記述に基づいて音楽を生成します。
3.テキストとメロディの両方に基づいて音楽を生成することも可能です。この場合、メロディの埋め込みを条件として追加します。
4.テキストプロンプトのシーケンスを提供することで、モデルが生成する音楽の進行を制御することもできます。
Soundraw(Canva AI)
Soundrawは、Canvaが提供するAI音楽生成サービスです。このサービスは、ユーザーが指定した「ムード」「ジャンル」「テーマ」を基に、10秒から5分までのオリジナル曲をAIが自動生成します。
Soundrawの特徴
Soundrawの主な特徴は以下の通りです。
1. テキストから音楽生成: ユーザーが入力したテキストに基づいて、オリジナルの楽曲を作ることができます。
2. 多様な音楽ジャンルに対応: ポップ、ロック、メタル、ユーロビートなど、多様な音楽ジャンルに対応しています。
3. 高品質な音楽生成: Soundrawはのべ28万時間分もの音楽で構成されたデータセットでトレーニングしており、テキストの内容にふさわしい音楽を生成できます。
Soundrawの料金プラン
Soundrawでは、曲の生成とカスタマイズは無料で、しかも回数制限もありません。ただし、生成した曲をダウンロードするのは有料です。
Soundrawの使い方
Soundrawの使い方は以下の通りです。
1. Soundrawの公式サイトにアクセス: WebブラウザからSoundrawの公式サイトにアクセスします。
2. テキストを入力: テキストを入力し、それを音楽に変換します。
3. 音楽を生成: 生成ボタンをクリックして音楽を生成します。
動画生成AI
Ranway
Ranwayは、AI技術を駆使して動画やテキストから動画を生成できるサービスです。画像生成AI「Stable Diffusion」の開発にも関与していることから、生成AI分野で注目されています。2024年6月17日にRanway Gen-3 Alphaがリリースされました。
Ranwayの特徴
Ranwayの主な特徴は以下の通りです。
1. 動画の生成や編集: Ranwayでは動画の生成や編集、画像からの動画作成など多岐にわたる機能を提供しています。
2. 直感的なインターフェース: クリエイター向けに設計されていることもあり、直感的に操作できるシンプルなインターフェースが魅力です。
3. スマートフォンにも対応: スマートフォンにも対応しており、どこにいても手軽に高品質な動画を作成可能です。
Ranwayの料金プラン
Ranwayの料金プランは以下の通りです。
- 無料プラン: 125クレジット、Gen-1 最大4秒、Gen-2 最大16秒(ビデオ拡張経由)、3つまでのビデオプロジェクト、5GBのアセット。
- 標準プラン: 15ドル/月、625クレジット/月、Gen-1 最大15秒、Gen-2 最大16秒、無制限のビデオプロジェクト、100GBのアセット。
- プロプラン: 35ドル/月、2250クレジット/月、Gen-1 最大15秒、Gen-2 最大16秒、無制限のビデオプロジェクト、500GBのアセット。
- 無制限プラン: 95ドル/月、2250クレジット/月(レート制限なし)、Gen-1とGen-2共に無制限で利用可能。
Ranwayの使い方
Ranwayの使い方は以下の通りです。
1. アカウント作成: Runwayの公式ウェブサイトにアクセスし、メールアドレスまたはGoogleアカウント、Apple IDを使用して新規アカウントを作成します。
2. ダッシュボード: ログイン後、ダッシュボード画面が表示されます。ここから各種機能にアクセスできます。
3. 動画生成: 「Generate videos」を選択して、動画を生成します。既存の動画から新たな動画を生成する「Gen-1」、テキストや画像から動画を生成する「Gen-2」、複数の画像から滑らかに変化する動画を生成する「Frame Interpolation」の3つの機能があります。
4. 動画編集: 「Edit videos」を選択して、動画を編集します。背景の削除、特定のオブジェクトを別のものに置き換え、字幕やモザイクを挿入などの機能があります。
5. 保存: 編集が完了したら、「Save」をクリックして動画を保存します。
Make-a-Video
Make-a-Videoは、Meta社が開発した高度な動画生成AIで、テキストから短時間で高品質な動画を生成することができます。この記事ではMake-a-Videoの特徴から他の動画生成AIとの比較、さらにはAI生成動画の懸念点まで詳しく解説しています。
Make-a-Videoの特徴
Make-a-Videoの主な特徴は以下の通りです。
1. テキストから動画生成: 短い指示文を与えるだけで、Make-a-Videoは文章の意味に合った動画を生み出します。
2. 画像から動画生成: 画像から動画を生成することも可能です。
3. 既存の動画を拡張: 既存の動画の時間を前後に延長することもできます。
4. 異なる動画をつなげる: 異なる2つのシーンを自然につなげることが可能です。
Make-a-Videoの料金プラン
Meta社が開発した動画生成AI「Make-a-Video」の料金プランは以下の通りです。
- 無料プラン:利用開始が可能で、特定の基本機能を利用できます。
- 有料プラン:2023年9月現在の月額料金は19.99ドル(約2,937円)。
Make-a-Videoの使い方
Make-a-Videoの使い方は以下の通りです。
1. Make-a-Videoの公式サイトにアクセス: WebブラウザからMake-a-Videoの公式サイトにアクセスします。
2. テキストプロンプトを入力: テキストプロンプトを入力します。これが動画生成の基になる指示となります。
3. 動画生成のオプションを選択: プロンプトに基づいてビデオを生成するオプションを選択します。
4. 生成されたビデオをプレビュー: 生成されたビデオをプレビューします。
5. 保存: ビデオが望み通りであれば、保存します。
今後期待される動画生成AI(参考)
Dream Machine(2024/6/13発表)
Dream Machineは、Luma Labsより2024年6月13日に発表されたばかりの新AIモデルで、現在無料で試用が可能です。
Dream Machineの特徴
・テキストと画像から高品質なリアル動画を生成
・120秒で120フレーム、迅速な動画制作が可能
・物理的に正確で一貫性のあるキャラクターと動作を実現
・縦横比:正方形(image 2 videoの場合はimageの比率が固定される)
・生成される動画時間:5秒
Dream Machineの料金プラン
リリースされたばかりのため、現在無料価格:無料(1日30回使用できる)で試用が可能になっています。
Dream Machineの使い方
Googleアカウントがあれば、公式サイトの右上にあるTryNowからプロンプト入力ページにアクセスできます。
Sora
Soraは、OpenAIが開発した動画生成AIツールです。このサービスは、テキストの指示を基にして最長1分の動画を生成することができます。
Soraの特徴
Soraの主な特徴は以下の通りです。
1. テキストから動画生成: ユーザーが入力したテキストに基づいて、オリジナルの動画を作ることができます。
2. 静止画から動画生成: 静止画をもとにした動画も生成できます。
3. 既存の動画を拡張: 既存の動画の時間を前後に延長することもできます。
4. 異なる動画をつなげる: 異なる2つのシーンを自然につなげることが可能です。
Soraの料金プラン
Soraの料金プランは現在未定です。具体的な料金については、OpenAI社からの情報を待つ必要があります。
Kling(2024/6/12現在、利用には中国の電話番号が必要)
Klingは、中国のショート動画共有プラットフォーム「快手(Kuaishou)」が開発した動画生成AIモデルです。このサービスは、テキストから最大2分間の動画を生成できます。
Klingの特徴
Klingの主な特徴は以下の通りです。
1. テキストから動画生成: ユーザーが入力したテキストに基づいて、最大2分間のフルHD動画を生成します。
2. 高品質な動画生成: Klingは、快手が自ら開発した「Large Vision Language Model(LVLM:画像処理可能な大規模言語モデル)」を使用しています。効率的なトレーニングインフラと推論最適化により、最大2分間、30fpsのフルHD動画を生成できます。
3. 複雑な時空間の動きをモデル化: 時間と空間を組み合わせた独自開発のアテンションメカニズム(注意機構)により、複雑な時空間の動きをより正確にモデル化し、物理法則に従ったダイナミックで大きな動きのある動画を生成できます。
Klingの料金プラン
Klingの料金プランは現在未定です。具体的な料金については、快手社からの情報を待つ必要があります。
Klingの使い方
Klingの使い方は以下の通りです。
1. 快影アプリをダウンロード: 快影アプリをダウンロードし、「Al玩法」をタップします。
2. 「AI生视频(AI映像生成)」のページを表示: 「AI生视频(AI映像生成)」のページが表示されたら「申请体验(申し込み)」をクリックします。
3. 中国の電話番号が必要: 中国の電話番号があればウェイティングリストに登録できます。
まとめ
AI技術の進化により、生成AIサービスは日々進化し続けています。今回ご紹介した生成AIサービスは、それぞれが独自の特徴と強みを持ち、ユーザーのさまざまなニーズに対応しています。
これらのサービスは、文章生成、画像生成、音楽生成、動画生成など、多岐にわたるタスクをこなすことが可能で、クリエイティブな作業を効率化し、新たな価値を生み出す可能性を秘めています。また、これらのサービスは、プロのクリエイターだけでなく、一般のユーザーにも手軽に利用できるようになっており、誰でも簡単に高品質なコンテンツを生成することができます。
しかし、生成AIサービスの利用には注意が必要です。AIが生成したコンテンツの著作権や、AIが提供する情報の正確性、プライバシーの保護など、さまざまな課題が存在します。これらの課題を理解し、適切に利用することが重要です。
今後も生成AIサービスの進化は続き、より多様で高品質なコンテンツ生成が可能になるでしょう。その中で、ユーザー自身が最適なサービスを選び、活用することが求められます。これらのサービスを活用し、自身のクリエイティブな活動を広げてみてはいかがでしょうか。