[B! scraping] klim0824のブックマーク

browser-useメモ

browser-useについて調査するどういうものかブラウザのデバッグプロトコルを使ってLLMで操作するpythonライブラリ Playwright API → Chrome DevTools Protocol (CDP) ClaudeのComputer useのスコープを狭めたものと理解できる似たツールとしてMCPのPuppeteerサーバーがある→mcp/puppeteer モデル（LLM）の呼び出しにLangChain Modelのインターフェイスに依存することでマルチプロバイダ対応してるなのでLangChainで動くモデルに対応してる結果的にLangChain風のAgentフレームワークのミニマムな実装になってる何ができるの？ブラウザ操作を自動化してできることはできる Hugging Faceで特定のライセンスを持つモデルを検索し、その情報をファイルに保存する求人情

klim0824 2025/01/03

リンク

browser-use やばいです - Qiita

はじめに語彙力なくてすみません、 browser-use は、「AI エージェントがウェブブラウザを操作できるようにする」ためのライブラリです。プロンプトで与えられた指示どおりに動き、ほかの技術と比較しても精度が抜群に高いです。早速試してみます。実践複数のECサイトから特定の商品価格を取得することを目標とする。 Python は 3.11 以上が必要です。

klim0824 2025/01/03

リンク

Node.js でお手軽スクレイピング 2020 年夏 - Qiita

皆さんは Web ページのスクレイピングって書いた事ありますか？私はあります。だってどんなに平和で平穏な生活を送っていても数年に一度はスクレイピングってしたくなりますよね。「うわーまじか！API ないのかよ…。」的な。そうしたら HTTP クライアントと HTML パーサのライブラリを探してきてインストールした上でごりごり書くことになると思います。でも実際に書いてみると、そうやってライブラリのインストールをしたりサンプルコードで動作確認している時間よりも、HTML を解析して実際にパースしたところから対象の要素を取得して欲しい値を取り出す試行錯誤の時間の方が長かったっていう事はないですか？今日ご紹介する Node.js でお手軽スクレイピングは、その辺の試行錯誤の手間を極力減らすことが出来る方法です。2020 年夏の最新版です。まずは環境から。特に古いものを使う理由もないので 202

klim0824 2020/07/22

リンク

くだらないAPIなんていらないよ – 2016年のウェブスクレイピング事情 | POSTD

ソーシャルメディアのAPIとそのレート制限は、あまり気分のよいものではありません。特にInstagram。あんな制限つきAPIを欲しがる人がいったいどこにいるんでしょうね？最近のサイトは、スクレイピングやデータマイニングの試みを阻止するのがうまくなってきました。AngelListはPhantomJSすら検出してしまいます（今のところ、他のサイトでそこまでの例は見ていません）。でも、ブラウザ経由での正確なアクションを自動化できたとしたら、サイト側はそれをブロックできるでしょうか？並行性を考えたり、さんざん苦労して用意した結果として得られるものを考えたりすると、Seleniumなんて最悪です。あれは、私たちが「スクレイピング」と聞いて思い浮かべるようなことをするためには作られていません。しかし、賢く作り込まれた今どきのサイトを相手にして、インターネットからデータを掘り当てるための信頼できる

klim0824 2016/12/03

scraping

リンク

Webスクレイピングのノウハウを公開します | 東北ギーク

photo credit: the local eye sore : man scraping illegal billboard, castro, san francisco (2014) via photopin (license) こんにちは。リスペクトの木村です。今回は「スクレイピング」についての話題をお送りします。スクレイピングとはウェブスクレイピング（Web scraping）とは、ウェブサイトから情報を抽出するコンピュータソフトウェア技術のこと。ウェブ・クローラー(Web crawler) あるいはウェブ・スパイダー(Web spider)とも呼ばれる。ウェブスクレイピング – Wikipediaより要するに、「APIを利用せずにWebページのHTMLデータを収集して、データを抽出したり整形する技術」の事を指します。収集方法も様々で、最近ではkimonoのようなサ

klim0824 2016/11/26

scraping
PHP

リンク

はてなブックマーク

タグ

関連タグで絞り込む (4)

scrapingに関するklim0824のブックマーク (5)

お知らせ

はてなブックマークの計画メンテナンスのお知らせ（2025年1月31日(金) 深夜1:30〜3:00）

ブックマークしたエントリーのタイトル変更機能の提供を一時的に停止します

【復旧済】「マイホットエントリー」「お気に入り」「関心ワード」が利用できない障害が発生していました

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス