[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

2025-01-29

生成AIでなんかやれと言われる皆さんへ(DeepSeekとばっちり編)

コンバンハ、オイソギデスカ

今日上司の思いつきで無茶振りされる皆さんお疲れ様です。

DeepSeekみたいな話題日経新聞に載るたびに新規事業になるんじゃ無いかとかプロトタイプをもってこいみたいなこと言われると災難ですよね。

何がどうなってて、何はできないんですよみたいなのまとめておいたから、俺の屍を越えてゆけ

まず前提から

確実なこと

ほぼ確実なこと

まだ明らかになっていないこと

面倒な上に、揉めそうなところ

ここまでは前提な。こっからが、まとめ。

技術的にもコスト的にも可能そうなところ

蒸留済みの生成AIモデルローカルで動かして、性能検証すること

外に出したく無いデータがあるからAzureAPIも使いたく無いんだよね、みたいな職場では朗報

いまんところモデルのものに変なものは仕掛けられていないし、QwenやLlamaよりもまあまあできる印象。

技術的には可能だが、コストは要相談なところ

かい生成AIモデルローカルで動かして、性能検証すること

できなくは無いけど、まっさら状態だと稟議通すの無理じゃ無いかな、という金額を載せざるを得ない。

すでにでけえGPUとかで生成AI用の環境を組んでるところなら、できるよね。

蒸留済みの生成AIモデルを、自前のデータを使ってさら蒸留すること

できなくは無いけど(以下略

既にQwenやLlamaを使って自前でなんかやっているところなら、後追いで強化学習のみでいけるか追試するなんてのはできる。

(こういう設備が既にあるなら、特にDeepSeekが出たから新しく、というわけじゃ無いけどね)

技術的にも(お前が雇えるような技術者とコストでは)無理ですね

DeepSeekの論文を読んで、生成AIを安く作れ

無理ですね。そもそも強化学習改善するのだってJTCなら部長決済で済まないでしょ。(外資ならワンチャンあるのか!?

そもそもベースの生成AIモデルを作るの、特に強化学習オンリーじゃなくてTransformerベースのよくある作りで作ってあるみたいだし。

生成AIモデルを自社向けに改良しろ

無理ですね。蒸留する(ベンチマーク用の性能改善ならいざ知らず、自社向けの定義データも揃わないでしょ。

ルールベースでやりくりした方がマシ。

技術的には可能かもしれないけど、まだやめといた方が良いこと

オープンな生成AIモデルを組み込んでプロダクトを作れ

プロトタイプならあり。ビジネスに組み込むつもりなら、少なくともDeepSeekの蒸留モデルは(まだ)使えない。

QwenやLlama派生モデル扱いなんだったら、MITライセンスになるわけがないので、かなりグレー。

同様に、(流石に多分大丈夫だと思うけど)DeepSeekの改善前のベースの生成AIモデルが、適法じゃなかった時揉めそう。

なお、これは別にDeepSeekに限ったリスクではなくて、QwenやLlamaも同じなんで、基本全部同じリスクを抱えてると思った方が良い。

余談

元になるベースの生成AIモデル作るところまでは、既存の作り方と同じなのでビックテック優位変わらず。

が、雑にベースの生成AIモデル作っても、わりあいお安く性能改善できるんで追いつけるね、というのは、多分正しそう。

なんで研究資料とかオープンにしてんの?というのは、多分2つくらい理由があって、その方が話題になって儲かるから、というのと、オープンにしておけば転職しても使えるから、というもの

カントリーリスクは相変わらずあるので、Web版とかAPIで使うなら、趣味の大っぴらにしてるプログラミングの補助で使うとか、ゲーム用になんかするとか、じゃないかな。

ローカルで使うって言っても、余程のことがない限りAPI使ってお支払いした方が、パソコン新調するよりはお安いのではないでしょうか。

低性能なの使ってもあんま楽しくないし、思いつくユースケースは、趣味コストをかけずにゲームに生成AI組み込みたいんで無限ローカル試行錯誤したい、くらいじゃないかな。

オープンソースになったんだからコモディティ化(?)して、生成AIは誰でも作れるようになる!みたいな言説はまだまだお花畑ですね。

設備投資もランニングコストも、日本ベンチャーとかじゃまともな勝負にはならんでしょ。

メモリ16GBノートPCで動く1GiBサイズでChatGPT-4oレベルの超蒸留モデルが出てから出直してきてくださいというところ。

そんな超絶技巧のスモールサイズAIよりは、AGIの方が先にきそうだけど。

まとめ

仕事で生成AIでなんかしろって言われたら、事実上選択肢は3つだけです。

  • Azure経由でChatGPT使う
  • GCP経由でGemini使う
  • AWS経由でSonnet使う

別に組み合わせても良いけど、これ以外の選択肢はいまんとこ取れないですね。

  • こーゆーので「しんきじぎょうだ!」とかゆっちゃう上司ってPay〇ayクーポンで100円のためにハンバーガー屋で2時間ならびそう

  • 一方、俺はDeepSeekのアカウントさえ作れずに泣いていた。 メアドで弾かれるんだけど、なんでだ?

  • API使うという選択肢はないんか

  • この増田の直後に「MSがAzureにDeepSeek R1をデプロイして蒸留モデルをCopilot+ PCに搭載するで」って言い出して草

    • 脱OpenAIを進めているのは分かっていたがそこまでとはな・・・😎

  • コンニチハ、オイソギデスカ 思ったより読まれてたので、ブコメにも出てたRAGの話を派生編として書いておくね。 最初に結論から、RAG案件は受けるな。(コンサルみたいにタイムチャー...

    • 生成AIの仕事全般、受託開発で受けない方がいいでしょ。 プロジェクトがぐだぐだになる要素が多すぎて、検収困難になる。 UIとAPIの繋ぎこみだけ担当します、結果何が出てきても一切...

  • てか、この話題を突き詰めると、『OpenAIのo1に匹敵すると自称するAIが、o1の1/30位の値段で使える』以上の話ではないはずなんだけど、まるで『ChatGPT3.5発表に匹敵する世紀の大発明』...

  • >低コストで高性能なAIモデル、オープンソースで実現--開発コストは約7万円 - ZDNET Japan https://japan.zdnet.com/article/35228433/ >Sky-T1-32B-Previewはオープンソースで、8基のNVIDIA製GPU「NVIDIA H100」を...

  • この怪文書になんでブクマ付けたの?

  • 設備投資もランニングコストも、日本のベンチャーとかじゃまともな勝負にはならんでしょ。 「日本のベンチャー」って具体的には何と何を比べてるの? アメリカの話か中国の話か...

    • PFN!

      • インフラのコストでなく技術開発力でないの 中国やアメリカが広いといってもド田舎にインフラ作ると苦労することは変わらん

    • 日本終わった論者って、昔の経済大国だった時代の日本と比較してるからそう思うんだよね 今の若者は、日本なんてもともとこんなもんだと思ってるから別に悲観してないよ

      • なお若者の自殺者過去最多

      • 失われた何十年も生まれた時から失われてたら「元々なかっただけ」って思うやろなあ

      • 国土も山がちで狭けりゃ地震は多いし台風は来るし大した資源もなんもねーもんね 魚が取れるくらい DHAのおかげで世界でも抜きんでて頭がいい国民ってことになってるのかな

  • 2023年夏頃からローカルLLMってHuggingFaceに大量に出てるけど、VRAMが24GBはないと300文字の程度の日本語要約すらできなかったりする。 AWSのEC2で借りてトライしようとしても、VRAMが24GB以上の...

  • https://anond.hatelabo.jp/20250129194915 生成AIを提供する某社で働いている。 昨今DeepSeekショックというかDeepSeekでショックを受けた顧客から色々言われるのでものを申したい。 Azure経由でChatGPT...

  • 「話題が日経新聞に載るたびに新規事業になるんじゃ無いか」あ~。 経営者にも新人にも日経新聞は禁止したほうがいいとおもうやで ビジネスパテントのとき当業界がどんだけ踊らされ...

  • シンガポール経由でNVDAのプロセッサ買ってる説はどう?

記事への反応(ブックマークコメント)

ログイン ユーザー登録
ようこそ ゲスト さん