[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

タグ

MacとLLMに関するigrepのブックマーク (3)

  • 「DeepSeek-R1-Distill-Qwen-1.5B」をM2 Pro Mac miniで動かしてみた

    DeepSeek-R1-Distill-Qwen-1.5Bとは 「DeepSeek-R1-Distill-Qwen-1.5B」の前に、まず「DeepSeek-R1」について簡単に紹介します。DeepSeek-R1は、DeepSeekによって開発されたオープンで高性能な大規模言語モデル(LLM)です。 DeepSeek-R1はパラメータ数が671Bの巨大なモデルですが、モデル圧縮手法の1つである蒸留を用いて小型化されたモデルも公開されています。 蒸留 (Distillation)とは、大規模な「教師モデル」の知識をより軽量な「生徒モデル」に移行することでモデルの圧縮をする手法です。深層学習モデルを軽量化するために使われています。 DeepSeek-R1の蒸留モデルは、既存のモデルであるQwenやLlamaをベースにDeepSeek-R1の推論パターンを学習させているようです。公開されてる6個

    「DeepSeek-R1-Distill-Qwen-1.5B」をM2 Pro Mac miniで動かしてみた
  • LLMプロダクト開発者がMac Studioを買ってローカルLLMを触るべき理由|erukiti

    もしあなたがLLMを使ったプロダクトを何かしら開発している、もしくは興味があるのなら、メモリを大量に積んだMac Studioの購入を検討すべきです。 対象読者NVIDIAが絶対にいいという人はこの記事の対象読者ではありません。また、用途によって、ローカルマシンによるローカルLLMが向いてる・向いてないは明確にあるので、向いてない用途にしか使わない人も対象読者ではありません。あしからず。 また、この記事は別にNVIDIAをdisる意図はありません。みんな違っていい。NVIDIAもいい選択肢ですが、Mac Studioも悪くないですよ、と言いたい。 結論LLMプロダクト開発において、今年はもはやローカルLLMを無視できない、してはいけない状況です。 LLMプロダクト開発をする会社の視点でいえば、是非とも80GB以上の十分なGPUメモリを積んだマシンを用意できるようなアジリティを持つのが望まし

    LLMプロダクト開発者がMac Studioを買ってローカルLLMを触るべき理由|erukiti
    igrep
    igrep 2024/04/24
  • GB Tech Trend #089: 自分の記憶をチャットで聞ける「Rewind AI」ChatGPT連携で急成長中

    GB Tech Trend #089: 自分の記憶をチャットで聞ける「Rewind AIChatGPT連携で急成長中2C向けAIスタートアップとして一抜けしそうな可能性を見せてくれます。 執筆: Universe編集部 今週の注目テックトレンド GB Tech Trendでは、毎週、世界で話題になったテック・スタートアップへの投資事例を紹介します。 誰もが望む「記憶のライブラリー化」を実現するスタートアップに注目が集まっています。 Rewind AIは、ユーザーのPC検索情報と音声マイクから録音された情報を蓄積・分析をした上で、ユーザーが過去にどんなことを調べて、どんなことにインスピレーションを得たのかを後で検索できるサービスです。GPTと連携した「Ask Rewind」が特徴的で、チャット形式で尋ねることで自分が行ったことについて記憶を呼び起こしたり、正確なキーワードを覚えていなくても

    GB Tech Trend #089: 自分の記憶をチャットで聞ける「Rewind AI」ChatGPT連携で急成長中
    igrep
    igrep 2023/05/26
  • 1