複数のAIをノードとして繋ぐComfyUIを試す。 | (めヮめ)＠めめみんおやすみん

矛盾抱える雑談系ポストプライムエンジョイ民

複数のAIをノードとして繋ぐComfyUIを試す。

複数のAIをノードとして繋ぐComfyUIを試す ※いつも通り結論も有益な情報もありません。進化の激しいAI。画像、動画、音声、音楽、文章など、得意分野の異なるAIが乱立している。それらの各AIをノードとして扱い、ノードをつなげてAI画像、動画、音声、音楽、文章などの生成を自由に組み立てられ、しかもローカルで使える最強ツール、それがComfyUI。・・・という触れ込みのComfyUIをちょっとだけいぢってみる。・切っ掛け。 SUNOがわたし好みの結構エモい曲を連発してくることは先に述べた通り。ただし、指示には従わないし何より音質がひどい。さらに学習データがいまいち不明瞭だし無料プランでは著作権も自分の物にはならない。それらをほぼすべて解消するものとして ACE STEPというAIが紹介されていた。これを利用するプラットフォームとして ComfyUIが紹介されていたのだった。（後で調べたら別にローカルのComfyUI 　じゃあなくてもオンラインから使えるっぽい）しかもComfyUIを使えば音楽だけでなく画像も動画も生成し放題というじゃないか！万二狼さんやてらさんもこういうの使ってんのか！？こいつはサクっと入れねば！ https://www.comfy.org/ ・導入インストール方法はいくつかあるが、 GitHub経由でPythonとその他ツールを導入。この時点で既にOpenAIやGeminiのような手軽さとは一線感じる人は多いだろう。でもAIに何かやらせるにもPythonを使えるように準備しておくとプログラミング言語を習得したような気になれるかもしれない。 https://gigazine.net/news/20260201-comfyui-image-video-generation-ai/ ・第一印象デフォルトのパラメータで生成したのはたしかにSUNO級のメロディと SUNO無償版よりだいぶいい音質だった。しかし、パラメータは結構細かく指定する必要がある。 BPMだとか曲の長さ、言語、曲調などなど SUNOのような雑な指示ではｷﾞｬｷﾞｬｰみたいな謎のノイズが生成されることもある。これはそれなりに音楽の組み立てが出来て無いと使えないかもも。 SUNOと違ってすぐに行き詰ってしまった。指示には従ってくれるのだけれども。 https://ace-step.github.io/ ・動かす過程で知った事。細かい指定を毎度するのではなく、ある程度学習させたデータをファイル化する LoRAという仕組みがあるという。絵柄だとか曲調だとかを読み込ませて学習させてスタイルとして安定出力させられるそうだ。なるほど、ジブリ風とかの違法学習させてたヤツはLoRAファイルにしてたんだな。キャラクターを安定出力するのとかにも使えるらしい。もしかして自分の絵柄を学習させたら自分の絵柄で色々生成できるのでは？たとえばぶろ子だとかぶる子とべあ子だとか！・・・まぁわたしの作品少なすぎて学習データとしては圧倒的に量が少ないのでしょうけれども。・思ったことそれに…LoRAだのComfyUIだのの仕組みを覚える… その時間と、自分で描く時間… どっちがわたしに有益なのだろう。技術的興味はある。創る喜びもある。両方やれるだけの時間と技術とバイタリティは絶望的に不足しているのだ。ただ… AIとの違いを頑張って言葉で説明するのに力を使うのは何となく嫌なんだよなぁ。受け手には関係の無いことだもの。