・AIエージェントとはなにか? ・AIエージェントの現在地はどこか? ・AIエージェントに関連した注目技術トレンド ・AIエージェントの課題と今後
この記事を読むたびに学びがあるなぁと感じていたが読むたびに忘れている気がするので現時点での理解を書き留めることで今後の学びの糧にしたい。本記事は元記事の全体を和訳する事や内容の全てを解説する事を目的としておらず、僕自身の学んだ事や振り返った事や噛み砕いた解釈を大いに含むので、本記事に書かれている内容は元記事の主張と一致している保証は全くない事を念頭においてほしい。 apenwarr.ca To paraphrase the book, the job of an executive is: to define and enforce culture and values for their whole organization, and to ratify good decisions. この本を言い換えると、幹部の仕事とは文化と価値を定義して強制し、良い決定を承認する事です。 元記事で言
次世代の変革をリードする20~30代のハイクラス向けキャリアアップ支援サービス「MELIUS(メリウス)」のマネジメントセミナーに、元マッキンゼーで現在はMELIUS事業責任者を務める田中直道氏が登壇。ピラミッドストラクチャーを作る際のポイントや、ピラミッドストラクチャーの「縦方向」と「横方向」の考え方などを解説しました。 前回の記事はこちら ピラミッドストラクチャーを作る際のポイント田中直道氏:ここまでピラミッドストラクチャーの基礎を説明してきましたが、このフレームワークは一番上に言いたいことを置き、それを下支えする根拠に分解していく構造です。これを作る際のポイントについて触れていきます。 具体的には、「縦方向」と「横方向」の意識が重要です。 まず、縦方向のポイントとして、階層構造が明確であることが挙げられます。サブピラミッドの要素は、必ず上位のメッセージを支える内容になっている必要があ
気づけばもう半年以上前の話になりますが、2024年5月、Interim CTOやSoftware Architectとして頑張って働いていた米国でスマートホームを開発するスタートアップ「HOMMA」からレイオフされ、事業を離れることになりました。入社時の夢いっぱいのブログエントリーはこちらからどうぞ。 ※ この記事は退職エントリーです。興味のある方だけお読みください。 何を作っていたの?最終的にどんなものを作ってたの?と思われると思うので、開発したプロダクトのデモを貼っておきます。ちなみに、この動画を作ったのも自分です。私物のBlackmagick Pocket Cinema Camera 4Kを持ち込んで、ポートランドの寒空の下、1人で撮影&編集しました。 タッチパネルが壁一面にあったり、音声クライアントやアプリで操作するドヤ!っとしたスマートホームではなく、埋め込まれたセンサーが人間の
既存RAGの課題、ハルシネーションやコンテキスト理解不足など 企業における生成AI活用では、情報の正確性が特に重視される。そのため、生成AIを利用する場合、検索拡張生成(RAG)の導入が一般的となっている。RAGとは、生成AIに外部データベースを接続することで、より正確な回答を生成する手法。RAGは特に文書要約やシンプルなクエリへの回答で優れたパフォーマンスを発揮するといわれている。 しかし、既存のRAGシステムには、いくつかの課題が存在する。課題は大きく4つに分類される。 第1の課題は、RAGだけでは情報の正確性が担保できないことだ。たとえば、営業担当者が商談の売上を問い合わせた場合、チャットログやメール、CRMなど、複数のデータソースが参照対象に含まれる。この場合、CRMが最も信頼できる情報源となるはずだが、RAGシステムは、自律的にそのことを判断できないため、古いメールから誤った情報
はじめに 2024年のAI界隈では「RAG」が一巡し、その可能性と限界が明確になってきました。最も顕著な点は「RAGは魔法の杖ではない」という認識の広がりではないでしょうか? RAGは確かに、既存の文書やデータを活用したAIの応答精度向上に貢献してきました。しかし、単純な質問応答を超えた複雑なタスクの実行や、動的な状況への適応には限界があることも明らかになっています。この限界を超えるための次のステップとして注目を集めているのが「AIエージェント」です。 OpenAIのCEOであるサム・アルトマンが「次のブレークスルーはエージェントだ」と発言していたり Anthropic社員がこのようなスピーチをしたりしています。 AIエージェントとは AIエージェントは、特定のタスクや目的のために設計された自律的なAIシステムです。たとえば、会議の参加者の予定を自動で調整して最適な時間を設定するAIアシス
こんにちは!逆瀬川 ( https://x.com/gyakuse ) です! 生成AI Advent Calendar 2024の記事を書くの忘れていたので、現時点での生成等AIの進歩をまとめてみました!今日はAIがいまなにできんの?ってこと聞かれたときにこれできるよ!って教えるためのメモとして活用してください!また、生成AIプロダクト Advent Calendar 2024というのもソロでやっています。このカレンダーではLLMの基礎理論からModelのFine-Tuning、プロダクト開発等をまとめています。ぜひこちらも見てください! 未来を感じる技術の進歩 動画生成では、Veo2 や Sora が登場しました。 インタラクティブな動画生成では、Genie2 (WASDと方向キーで操作可能な世界モデル)が非常に革新的な進歩を遂げています (振り返っても一貫性を保つ長期性が本当にすごい
サイバー攻撃が日々進化する現代社会において、セキュリティエンジニアの役割はますます重要になっています。しかし、「セキュリティエンジニア」という肩書きの下には、実に多様な専門分野と役割が存在します。 200職はものの例えですが、今回その多種多様な仕事を分類化してみました。 もしセキュリティに興味があり、今後セキュリティエンジニアになってみたいと思う方の一助になればと思います。 そもそも「セキュリティ」の仕事とは? (サイバー)セキュリティの仕事と言われて思い浮かべるものは何でしょうか? サイバー攻撃が起きたら冷静に解決に導く 開発したプログラムにセキュリティホールがないかチェックする 企業の製品やサービスの脆弱性を見つけて賞金を稼ぐ ハッカーのようにマルウェアや攻撃方法を調査して、次の攻撃に備える 実際に攻撃を仕掛けてみて、システムの防御力をテストする どれも「セキュリティ」の仕事の一部です
聴いたことがある曲の一部分が頭の中で何度も繰り返される、“音楽が頭にこびりついて離れない”現象(イヤーワーム/ディラン効果)。音楽心理学者とオーディオエンジニアが協力して科学的に設計された“頭にこびりついて離れない音楽”を消すために特別に作られた40秒間のオーディオトラック「The Earworm Eraser」を知っていますか? 米国の公共ラジオ局NPRが特集しています。 12月に入り、ホリデー/クリスマス・シーズンの定番曲がさまざまな場所で流れる季節となりました。NPRは「クリスマスに欲しいのは...この曲を頭から追い出す手助け」と題して、「The Earworm Eraser」を特集しています。 「The Earworm Eraser」は、頭の中で何度も何度も繰り返し再生されて、なかなか消えない曲、いわゆる“頭にこびりついて離れない音楽”を消すために特別に作られた40秒間のオーディオ
癌治療を専門にしている医師ですが、夜寝付けなかったので、 癌になった時にまず最初に知っておいて欲しい事をかいてみました。 結論いかに早く治療を開始できるかで癌の治りやすさが変わります。 そして、あなた(患者)の頑張りで、治療開始日は大きく変化します。 今回は、知っておいて欲しい癌の知識について書いた後、癌の疑いがあると言われた時の治療開始RTAのコツについて書きます。 (RTA:リアルタイムアタック、いかに早くゲームをクリアできるかの挑戦の事) --- 知っておいて欲しい癌の知識 癌は、ひたすら増え続けるおかしな細胞人間の体は細胞で出来ていて、正常な細胞は決まった日数で細胞分裂して増えますし、決まった日数で死にます。例えば皮膚の細胞は1か月くらいで新しくなって、古い細胞は死んで垢になります。このバランスが保たれているのが通常です。 ただ、変な細胞も一定の割合で発生します。決まった日数で死な
ジェネラティブエージェンツ の 吉田真吾(@yoshidashingo)です。 今年3月に創業して以来、共同創業者3名が毎日会話しながら、ときに開発の手を止めてまで書いていたAIエージェント本(LangChain/LangGraph本)が11/9(土)に技術評論社から発売されます。 gihyo.jp みなさん、もう予約いただけましたか? Amazonでも予約段階からつねにいずれかのカテゴリーのランキングに入っており、注目度の高さがうかがえます。 LangChainとLangGraphによるRAG・AIエージェント[実践]入門 作者:西見 公宏,吉田 真吾,大嶋 勇樹技術評論社Amazon 予定では260ページ→最終的に496ページ 具体的な構成について検討する中で、当初は昨年のLangChain本と同程度である260〜270ページと想定して企画していたのですが、最終的にいろいろ欲張って詰め
生成AI(人工知能)に欠かせない高性能のGPU(画像処理半導体)を搭載したサーバーを大量に運用できる「AIデータセンター」は、日本にどれだけ存在するのか。日経クロステックが国内にある49社のデータセンター事業者を対象に調査したところ、18社による計画中を含む32施設があることが分かった。 今回、日経クロステックがデータセンター事業者に質問したのは、大規模言語モデル(LLM)のトレーニング(訓練)や推論に使う高性能GPUサーバーが稼働できるような施設と、その詳細だ。現時点では国内に18社が運営する26施設があり、今後さらに6施設が増える計画だ。 消費電力10kW超えのGPUサーバーを1ラックで複数台稼働 LLMのトレーニングには、米NVIDIA(エヌビディア)のAI用GPUである「H100」や「H200」を8個搭載する高性能GPUサーバーが向いているとされる。NVIDIA自身がH100を8個
ガートナージャパンが「日本における未来志向型インフラ・テクノロジのハイプ・サイクル:2024年」発表。Web3やNFTは幻滅期、生成AIは過度な期待、汎用AIは黎明期 調査会社のガートナージャパンは、「日本における未来志向型インフラ・テクノロジのハイプ・サイクル:2024年」を発表しました。 ハイプサイクルとは ガートナーのハイプサイクルは、技術の登場から安定までを5つのステージに分けて説明したものです。5つのステージは、「黎明期」から始まり、「『過度な期待』のピーク期」「幻滅期」「啓発期」「生産性の安定期」まで。この途中で消えていく技術もあります。 米調査会社のガートナーはグローバルな視点で毎年「先進テクノロジのハイプ・サイクル」を発表していますが(今年もおそらく間もなく発表されると思われる)、今回発表されたのは日本において、未来志向型と捉えられるテクノロジやトレンドとなっている40のキ
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? はじめに この仕事を始めた当初(約20年前)はオンプレミスという言葉がありませんでした。いや厳密には私の周りではパブリッククラウドとオンプレミスを分けて話す人はおらず、インフラ構築といえば今でいうオンプレミスが中心でした(世の中的にはパブリッククラウドがサービスとして存在していました)。オンプレミスみたいに新しい概念が出てきた時にそれまでの概念を説明するためにできる言葉をレトロニムというそうです。 私が本格的にパブリッククラウドの仕事をし始めたのは約3年前でAWSでした。研修ではAzureを先に触れていたのと、この本を読んでいたという知
RAGの精度改善するために何があるかを学びました。基本系のNaive RAGを知っている人向けの記事です。 方法が多すぎるので、Youtubeの「RAG From Scratch」を中心に少し整理してみました。LangChainをよく使っているので、LangChain出典が多いです。 全体像 まずは、RAGの全体像。Indexingが同じ流れにあるのが少しわかりにくいのですが、実行タイミングとしてはRAGの前準備としてやっておきます。 画像出典: RAG from scratch: Overview もう少し粒度を細かくした図です。 画像出典: RAG from scratch: Overview 表形式で分類します。Generationだけ少し特殊です。 大分類 中分類 内容
ssmonline #43 での発表資料です。 (運用設計ラボ合同会社 波田野裕一)
Microsoft、RAGの機能を拡張、強化させたGraphRAGを一般利用可能に Microsoftは2024年7月2日、LLMが生成する出力の精度を向上させるために利用するRAG(検索拡張生成)の機能を拡張/強化した「GraphRAG」をGitHub上で公開した。 GraphRAG: New tool for complex data discovery now on GitHub -Microsoft Research Blog Welcome to GraphRAG RAG(Retrieval-Augmented Generation:検索拡張生成)は、ユーザーのクエリに基づいて特定の分野や組織の内部ナレッジベースの情報を検索し、その結果を参照してAIの回答に組み合わせる技術。モデルを再トレーニングすることなく、これらの情報を生成結果に即座に反映できる。 一方、通常のRAG
大規模言語モデル (LLM) の学習データに含まれない知識(各社の特有の書類など)を踏まえてLLMに回答させる際に最早必須となってきたRAG (Retrieval-Augumented Generation)。 今回はそんなRAGのSurvey論文を元に、RAGの変遷や構成要素、新たに出てきた技術を俯瞰していきます。 Survey論文へのリンクはこちら arxiv.org RAGとは LLMはそれ単体で回答させると、質問によってはハルシネーションや学習時のデータにはなかった情報を生成時に加味できないといった問題から正しくない回答を生成することが多々あります。例えば世間一般に公開されていない自社の就業規則や業務標準についてをChatGPTに質問しても、正しい回答は得られません。 そのような問題への対応としてRAGが使われます。 「LLM単体で適切な回答を生成できないなら、ユーザーの質問を元に
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く