Address
:
[go:
up one dir
,
main page
]
Include Form
Remove Scripts
Accept Cookies
Show Images
Show Referer
Rotate13
Base64
Strip Meta
Strip Title
Session Cookies
More Web Proxy on the site http://driver.im/
Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
CloudflareStack でRAGに入門
Search
Asahi
December 12, 2024
Programming
0
130
CloudflareStack でRAGに入門
Asahi
December 12, 2024
Tweet
Share
More Decks by Asahi
See All by Asahi
Cloudflare WorkersにNext.jsをデプロイしてみる
asahiiwm
0
21
Other Decks in Programming
See All in Programming
ある日突然あなたが管理しているサーバーにDDoSが来たらどうなるでしょう?知ってるようで何も知らなかったDDoS攻撃と対策 #phpcon.2024
akase244
2
7.2k
20年もののレガシープロダクトに 0からPHPStanを入れるまで / phpcon2024
hirobe1999
0
890
快速入門可觀測性
blueswen
0
450
fs2-io を試してたらバグを見つけて直した話
chencmd
0
260
GitHubで育つ コラボレーション文化 : ニフティでのインナーソース挑戦事例 - 2024-12-16 GitHub Universe 2024 Recap in ZOZO
niftycorp
PRO
0
520
AWSのLambdaで PHPを動かす選択肢
rinchoku
2
330
これでLambdaが不要に?!Step FunctionsのJSONata対応について
iwatatomoya
2
3.8k
生成AIでGitHubソースコード取得して仕様書を作成
shukob
0
560
LLM Supervised Fine-tuningの理論と実践
datanalyticslabo
7
1.6k
Оптимизируем производительность блока Казначейство
lamodatech
0
770
良いユニットテストを書こう
mototakatsu
11
3.3k
AppRouterを用いた大規模サービス開発におけるディレクトリ構成の変遷と問題点
eiganken
1
200
Featured
See All Featured
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
7
530
Faster Mobile Websites
deanohume
305
30k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
6
470
Raft: Consensus for Rubyists
vanstee
137
6.7k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
18
2.3k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
33
2.7k
Fontdeck: Realign not Redesign
paulrobertlloyd
82
5.3k
Agile that works and the tools we love
rasmusluckow
328
21k
GraphQLの誤解/rethinking-graphql
sonatard
67
10k
Scaling GitHub
holman
459
140k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
3
310
Into the Great Unknown - MozCon
thekraken
34
1.5k
Transcript
CloudflareStackでRAGに入門 いわみ あさひ
• 自己紹介 • Cloudflare Stackについて • RAGについて • 構成 •
できたもの • 今後やってみたいこと • まとめ アジェンダ
株式会社Gemcook所属: あさひ(@asahiXXXXXXXXX) バックエンドエンジニア TypeScript、Go、AWS、Cloudflare 歴1年くらい 好きなサービス・OSS Workers、Hono、CDKが好き 趣味 配信(見る方)、StreetFighter6、LoL
自己紹介
株式会社Gemcook所属: あさひ(@asahiXXXXXXXXX) バックエンドエンジニア TypeScript、Go、AWS、Cloudflare 歴1年くらい 好きなサービス・OSS Workers、Hono、CDKが好き 趣味 配信(見る方)、StreetFighter6、LoL
自己紹介 Zennで 週刊Cloudflare という記事を 毎週出しています。 Zenn: あさひ@asahi_iwm
Cloudflare Stack
• Cloudflare DeveloperのYoutubeで紹介されていた ◦ The Cloudflare Stack • どこかで説明されてるわけでは ないがCloudflareのサービスを
スタックとして理解 Cloudflare Stackって?
RAG
• RAG(Retrieval Augmented Generation) ◦ 事前情報を与えてそれを踏まえて回答を生成して くれるやつ ◦ 通常のLLMだとそのモデルが学習した時点まで の情報でしか回答を生成してくれない
RAGって何?
今回の構成
• Workers ◦ Hono ◦ Drizzle • Workers AI •
D1 • Vectorize 今回の構成
D1にナレッジを保存する コンテンツをベクトル化 ナレッジ(事前情報)を保存する流れ VectorizeにD1のIDと一緒に保存
ナレッジ(事前情報)を保存する流れ
ナレッジ(事前情報)を保存する流れ
ナレッジ(事前情報)を保存する流れ
回答を生成する流れ 質問をベクトルデータにする 類似するベクトルデータを探してナレッジを探す ナレッジをコンテキストとし AIに回答を生成させる
回答を生成する流れ
回答を生成する流れ
回答を生成する流れ
回答を生成する流れ
回答を生成する流れ
できたもの
• Demo ◦ めっちゃ簡単にやります できたもの
今後やってみたいこと
• AI Gatewayを使って日本語対応 ◦ Workers AIに日本語モデルがない… • Streamingレスポンス対応 • 画面を用意する
• D1以外の採用(KVとかR2) • RAGを活用して何かを作ってみる 今後やってみたいこと
まとめ
• Cloudflare Stackで RAGに入門することができた • 基礎的なRAGの仕組みは理解できた • 日本語対応モデルがないのが残念 まとめ