「ポケットにAI入ってる? ② 」 スマホアプリ “copilot” での画像生成のヒント

まめ知識

浮かぶ金色の音符に囲まれたカラフルなガラスで作られたバイオリン。このシーンは、芸術的で活気のある雰囲気で、楽しさとダンスの感覚を呼び起こすはずです。ガラスのバイオリンから来る美しく活気のある音楽は、構成を強化し、動きと喜びの感覚で拡張された空間を満たします。


前回の記事でご紹介したモバイル版(スマホ・タブレット)「copilot」と「ChatGPT」は試してみたでしょうか?

今回は「copilot」の画像生成機能について、どのようにして画像を生成していくのか、具体的な例を挙げて、少しだけ掘り下げてみようと思います。

この記事を書こうと思った大きな理由として、マイクロソフトの著作権と商用利用について再度調べた結果、大きな変更があったことが一つ。
「商用利用はダメ」と言い切ってしまったことの訂正をしなければならないと思いました。
情報が古かったです。

もう一つの理由として、せっかく「使っていいよ」となったのなら、「みんなが上手に活用できるように! 」と思いました。

現在、画像生成AI は色々とあるけれど、どれも料金のかかるもので、無料のスマホアプリで誰でもタダで使えるこの機能を、「使わない手はない!」と思ったこと。

画像生成の際にちょっとしたヒントがあれば、それぞれ職場であったり、サークルであったり、さまざまな場面で使える幅が広がるだろうと思いました。

今回はきっちりとまとめるのではなくて、入り口の部分と思って下さい。
プロンプトも入れていくので、気に入った画像のプロンプト(指示書)は、スマホの場合は指で長押しして、そのままコピーして、キーワードだけご自身の欲しい画像に書き換えて使って下さい。

ブログを読んでくれている方々が「それぞれの職場で活用できるように!」と思ってまとめていきます。

今回は、画像生成に興味のある方、または職場やさまざまな場面で「会員募集のチラシ」とか「お便り」などを書かれる方向けに、実用的なものを中心に、私が学習した内容を少しだけまとめます。

これから画像生成AIを使おうと思っている方には、きっと役に立つと思います。

本題に入る前に、copilotの著作権と商用利用について、触れていきます。

前回、「商用利用はダメ」と書いたのですが、最近、マイクロソフトは「copilot」の利用規約を更新したので、まずはここをお伝えします。

モバイル版(無料版)のcopilotには、それのみの明確な利用規約が見当たらないので、“Microsoft365” 利用時に搭載される機能も合わせた「copilot」全体の利用規約に含まれると解釈します。

まずはそこについてまとめます。

Copilotで生成された画像の著作権や商用利用に関する最新の情報  

2024年5月現在の情報です。

  1. 2023年末から2024年初めにかけての利用規約の変更
    以前の「非商用利用のみ」という明確な方針から、「Microsoftは創作物の所有権を主張しない」という曖昧なものに変わりました。
    現在、Microsoftのサービス、例えばCopilotやBing AI、または「Image Creator from Designer」から生成されたAI画像の使用に関して「非商用利用のみ」という言葉がなくなったことで、ここの制限もなくなりました。
  2. 商用利用に関して
    特にウォーターマークや帰属を追加する必要はありませんが、著作権侵害や盗用を避けるためにウォーターマークを追加することが推奨されています。
  3. Microsoft Copilot Copyright Commitment
    2023年10月1日から、MicrosoftはCopilotサービスの使用および生成された出力コンテンツに関するIP侵害の主張から顧客を守ることを提供しています。
    これには、顧客が製品に組み込まれたガードレールやコンテンツフィルターを使用し、侵害する素材を生成しようとしない限り、第三者による著作権侵害で訴えられた場合、顧客を守り、訴訟から生じる不利な判決や和解金を支払うことが含まれます。

    …この部分については法人向けの変更で、昨年9月、Microsoft社が「Microsoftが企業向けに提供している一連の生成AIツール「Copilot」の顧客に対し、このサービス使用中に著作権侵害で訴訟を起こされた場合、法的責任を負う」と発表したことでの変更です。
    前回は著作権などで訴えられた場合「法人向けに限り、マイクロソフトがサポートしてくれるかもしれない」と書きましたが、ここがより強力に「完全にサポートする!」となりました。

ちょっと、何が何やら…わかりずらいでしょうか。
重要な変更点は…特定の条件下での商用利用が可能となったということです。

商用利用がOKとは言ってないのです。
ただ、ダメではない。Microsoftは関知しないので、自己責任でご自由にどうぞ、ということです。

では、特定の条件とは?

  1. 著作権に関する遵守
    生成される画像が既存の著作権を侵害していないことを確認する責任がユーザーにあります。
    たとえば、特定のキャラクターや著名なブランドロゴが含まれる画像を無断で使用することは避ける必要があります。
  2. 使用許可と制限
    商用利用が可能でも、例えば広告や販売目的での使用は許可されているものの、政治的なキャンペーンや不適切なコンテンツ作成には使用できない場合があります。
  3. クレジットの表示
    画像を商用利用する際には、場合によっては生成ツールの名前や提供元をクレジットとして明記する必要がある場合があります。
    …クレジットというとお金の問題みたく捉えがちですが、そうではなく、著作者・提供者を明記することです。
  4. 改変の許可
    生成された画像をさらに編集または加工することが許可されているか、またその範囲についても規約で明記されています。

この変更で、著作権などをしっかり守れば、自己責任において商用利用可能、つまりお金儲けに使ってもMicrosoftは関知しないとなりました。

もちろんお金目的ではない「学校のお便り」「町内会の会報」「自治体の広報誌」などの発行物への利用も、Microsoft社は関知しませんし、全く制限はありません。

「何に使ってもかまいません。」となりました。

というか、制限をかけていては、他社に乗り換えられてしまうのでしょう。

私がメインとして使っているAdobe社の「fire fry」という画像生成AIは、Adobe社の大量の画像ストックと著作権の切れたもの、それに加え、世界中の方々が日々生成し続けている画像とその技術をAdobe社が買い取って、その中だけを参考にした画像を提供する仕組みとなっているので、枠の外には出ないようになっています。
(今の所、商用利用可能と文書で全面に打ち出しているのは、これだけです。)

人気アニメなんかは生成できない、著作権のあるものは生成しない仕組みです。

一方、copilotに搭載されている「DALL-E 3」はネットを通して情報を収集していると思われるので、例えば「ドラゴンボールの悟空がカメハメ波を打つ画像」と入力すれば、そのまま、出してしまいます。

これは使ったら、アウトです。

「自由に使って良いけど、ここ(著作権)は気をつけて下さい。自己責任ですよ。」
ということです。

初めに「DALL-E 3」について

「DALL-E 3」は、「Open AI 社」が開発した、テキストから美しい画像を生成する脅威の技術です。

無料版のcopilotにも、この「DALL-E 3」が搭載されています。
有料版と比べ、多少の差はあるかもしれませんが、なにせ「DALL-E 3」は世界の最先端を走る画像生成AIの1つです。

無料版とえどもやはり桁違いに “素晴らしい!”

何がというと、「言葉を理解し、その世界を作る」ということに関して、そこは「Chat GPT」を作り出した「Open AI社」(言語理解能力) の強みの部分でもあると思いますが、想像以上のものをつくり出してくれます。

ここから、使えるプロンプト(指示書)の参考事例と共に、まとめていきます。

美しい画像をつくる「プロンプト」の書き方

この技術の魅力は、提供されたプロンプトの 各単語” が、生成される “画像の細部にまで影響” を及ぼす点にあります。

プロンプト
輝く妖精の光によって内側から照らされた複数のガラス瓶をフィーチャー
した夢のような魔法のシーン各瓶には小さくて魅惑的なシーンが含まれています。ある瓶には、きらめく星の下の草のパッチに座っている小さくて繊細な妖精がいて、別の瓶は小さなカラフルなキノコの横に妖精を示しています。瓶は木製の表面に置かれそのライトは周囲に暖かく魅力的な輝きを放ち居心地の良いおとぎ話のような雰囲気を作り出します。全体的なシーンは暖かい色と輝きに富んでいます

これは有料版の方の「DALL-E 3」(以下、“ダリさん”とします)への、私のプロンプト(指示書)です。
私一人でここまで作るのは難しいので、「Chat GPT」(以下、“GPTさん”とします)の力も使ってます。

前段で「提供されたプロンプトの各単語が、生成される画像の細部にまで影響を及ぼすと書きました。

どうでしょう。
よく理解して、不思議な世界を作ってくれました。

プロンプトは明確かつ詳細に指示を書くことが重要です。
そうでないと、なかなか理解してくれない時もあります。
詳細な記述は、画像のクォリティを向上させることに繋がります。

なんとなく、掴めたでしょうか?

例えば、
「森にあるコテージを描いて下さい」は、

「太古の木々に囲まれたコテージは大木と同化しているようで、メルヘンの様相の家の中からは柔らかな光が見えます。おとぎ話のワンシーンのような画像を描いて下さい。」

と入力することで、全く違う雰囲気になります。

ちなみに、うまくできたものは、画像もプロンプトも販売できます。
商用利用可能ですから。

私は基本的に、ダリさんに対しても敬語を使います。(AIだけど)
生成AIは丁寧な言葉には丁寧な言葉で答える、荒い言葉には荒く答える、つまり相手に合わせる傾向があります。

なので、使い込むうちに自分の好みに合ってくるということも合って、(過去に私が「いいね」と評価したものを記憶していきます) 敬語を使うようにしています。

別に「生成しろ」でも「描け」でも、かまいません。

「なるほど、こんな感じで入力するのか」と思っていただけましたでしょうか?

【ギャラリー】

全て、スマホ版copilotで生成しました。
参考にしてみて下さい。

もしも気に入ったものがあれば、画面を長押しして、ご自由にダウンロードして下さい。

大きな要となる「キーワード」もヒントとして入れておきます。

この画像を参考に、いろいろな比喩なんかを駆使しながら想像力を掻き立て、独自のプロンプトを試してみて下さい。

実用的な画像を作る

実際に仕事で使ったり、所属している団体の会員募集なんかのポスターをつくったり、学校のお便りや区会つうしんのちょっとしたスペースに入れたいイラストは、前段のようなものではないですよね。

もっとシンプルで素朴なものが欲しいと思います。

ピッタリとあうイラストをネット上のフリー素材から見つけるのは大変です。
なかなか見つからなかったりで検索するのも結構時間がかかります。

フリー素材と思って使用したら後から請求が来たり、トラブルになったりという事例もあります。

これからは、そんなことはありません。
欲しい画像を自分で生成する時代です。

その手法を覚えておくと、とっても便利です。
では、そのような画像を得るための具体的な指示書(プロンプト)の書き方を紹介していきます。

プロンプト
:子どもが読書をしている: 線画のイラスト、白と黒だけ、少ない線でシンプルな画像を描いて下さい。

プロンプトの画面を指で長押しして、コピーする範囲を指定してからコピーをして、そのままcopilotに貼り付けて使って下さい。「 :◯◯◯: 」だけ、お好きに入れ替えて下さい。

プロンプト
:運動会で走っている二人の子ども: 線画のイラスト、白と黒だけ、少ない線でシンプルな画像を描いて下さい。

最初のプロンプトと同じです。

プロンプト
:お絵描きする子ども: のイラストを描いて下さい。ゆるくて素朴、白と黒だけ、少ない線のミニマリズム。

画像は上手にできないこともあります。
足が1本多かったり、指の数が少なかったりすることがあります。

上手くいかない時は、再度打ち込んで、最後に
「プロンプトは英語で出して下さい。」
と付け加えて、やり直してみるか、
あるいは、日本語で指示した後に、下記をコピーして最後に貼り付けるかしてみて下さい。
「rewrite natural English and then use this prompt」

今回は、ここまでにします。(^ ^)
参考になれば、嬉しいです。