日本の科学研究が振るわない理由に、研究費不足を指摘する声がある。統計をみると国内総生産(GDP)に占める大学や公的研究機関、企業の研究開発費の割合は2022年度に約4%で米国と同水準で、欧州連合(EU)より7割高い。日本全体の研究費が少ないとは言いにくそうだ。だが、大学に限っては事情が異なるかもしれない。国は04年度に国立大学を法人化した後、人件費などに充てる運営費交付金を削り、優れた研究に配
では、それぞれ見ていきましょう。 arXiv AI/ML関連における一次情報源として欠かせないのがarXivです。 しかし、最近はプレプリントの投稿数が爆発的に増加しており、そのままarXivを見に行くとノイズが多すぎて、本当に価値のある論文を見つけるのが難しくなっています。 学会のトップ論文をチェックするという手もありますが、査読プロセスを経るため情報がどうしても遅くなりがちです。 そこで役立つのが、新鮮な論文を適度にキュレーションしてくれるサービスです。ここでは特におすすめの3つを紹介します。 Hugging Face - Daily Papers AI界隈で有名なAKさんをはじめとするHugging Faceのメンバーが、arXivから毎日厳選した論文リストを公開してくれているサービスです。 土日はお休みしていますが、平日は結構な量(多い日だと40本程度)の論文が選定されています。こ
本記事は、DeepSeek-R1の論文とDeepSeekMathの論文を読んだ私の理解をもとに記載しています。 本論文で使われている技術に関しては、ある程度の知識を持っているので、大きくは外していないとは思いますが、私の主観も入っている部分もありますので、ご了承ください。 また、DeepSeek-R1の論文が公開される前に、小型モデルに対して同様の実験(強化学習)をしていたグループがあるようです。 そちらのレポートは下記になります。 意図せず、DeepSeek-R1-Zeroの再現実験のようなレポートになっていますが、レポートの著者はDeepSeek-R1論文の公開前から実験していると主張しています。 こちらも非常に興味深かったため紹介です。 本論文の興味深いところ 本論文は、大きく分けて3つの構成でできています 強化学習による思考能力の強化 LLM(DeepSeek-V3-Base)に対
ほとんどのAIベンチマークはAIの出力精度(スキル)を測定するものですが、スキルはAIの知能を表すものではありません。スキルではなくAIの知能を測定するため、AIがスキルを効率的に習得する能力を測定するベンチマークが「ARC-AGI」です。そんなARC-AGIの開発者であるフランソワ・ショレ氏が立ち上げた「ARC Prize」が、話題の中国AI企業DeepSeekの最新推論モデルである「DeepSeek-R1」ファミリーについて分析しています。 R1-Zero and R1 Results and Analysis https://arcprize.org/blog/r1-zero-r1-results-analysis ARC Prizeの目標は汎用人工知能(AGI)に向けた新しいアイデアを定義・評価することです。そのため、ARC Prizeは可能な限り最強のグローバルイノベーション環境
「DeepSeek-R1」の概要をまとめました。 1. DeepSeek-R1「DeepSeek-R1」は、「DeepSeek」が開発した、オープンで高性能なReasoning能力を持つ大規模言語モデルです。2025年1月に発表され、OpenAIのo1と同等の性能を持つとされています。 ・deepseek-ai/DeepSeek-R1 特徴は、次のとおりです。 ・強力なReasoning能力 強化学習を用いた革新的なアプローチにより、特に数学や科学的推論において優れた性能を発揮。 ・オープン MITライセンスのもとで提供さている。 ・低コスト API価格が「OpenAI o1」の25分の1以下と、非常に低価格で利用できる。 ・長いコンテキスト長 最大128Kトークンのコンテキストを扱えるため、長文の処理や要約に優れている。 Webサイトと API が現在公開されています。今すぐ http:
はじめに 2025年1月、DeepSeek社が画期的な言語モデル「DeepSeek-R1」を発表しました。このモデルは、強化学習を中心とした革新的なアプローチにより開発され、OpenAI-o1-1217と同等の性能を達成しながら、完全なオープンソース化を実現しました。 DeepSeek-R1の特筆すべき点は、純粋な強化学習による訓練から始まり、段階的な改良を重ねることで高い性能を実現したことです。特に数学や科学的推論のタスクにおいて優れた成績を収めており、AIIMEやMATH-500などのベンチマークで印象的な結果を示しています。 さらに、このモデルは1.5Bから70Bまでの様々なサイズで提供され、MITライセンスによる公開により、研究目的から商用利用まで幅広い活用が可能となっています。本記事では、DeepSeek-R1の技術的特徴、性能評価、実用面での特徴について詳しく解説していきます。
海の目の前に建つ異色の酒蔵 日本酒の味は、水に大きく左右されると言われる。適しているとされるのは、伏流水や雪解け水だ。山地に降った雨や雪が地中に染み込み、地層に沿って流れる水だ。それらの水は地層によって濾過され、土壌のミネラル分を取り込む。カリウムやリン酸、マグネシウムを含む、酒造りに適した水質になっていくのだ。 ここまで読んで、酒蔵のある街をイメージしてほしい。「雪深い里山の麓、清水がたどり着く自然豊かな農村」みたいな風景を思い浮かべてはいないだろうか。実際、そんな風景のある東北は酒所として有名だ。 だが、取材に訪れたのは茨城県日立市。明治後期に日立鉱山が拓かれて以来高度経済成長の波に乗り、全国でも有数の工業都市として発展を遂げた海辺の街だ。しかも森島酒造があるのは、太平洋に面する川尻海水浴場からわずか70歩。潮風が漂い、髪が塩気を帯びるロケーションである。 「東京のど真ん中でもうまい酒
掲載料を目的にずさんな審査で論文を掲載する「ハゲタカジャーナル」とみられる粗悪な学術誌が、生成AI(人工知能)を使って「フェイク論文」を作成し、その著者として日本の研究者3人の名前を無断で使っていることが、毎日新聞の取材で判明した。3人はいずれも学術誌側との関係を否定。ハゲタカ誌による生成AI悪用の被害が日本人研究者に広がっていた。その狙いはどこにあるのか? 偽論文を載せていたのは、バルセロナとブリュッセルに拠点を置くと称する学術出版社。森林生態学や水管理などの分野の論文をウェブサイトで公開している。論文掲載前に査読(内容チェック)があるとしているが、ハゲタカ誌を発行している可能性のある世界の出版社について米国の専門家がまとめたリストに、同社も名を連ねている。 この学術誌が2012~24年に掲載した全352本の論文を調べたところ、少なくとも3本の著者が、実在する日本人研究者の名前になってい
このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。通常は新規性の高い科学論文を解説しているが、ここでは番外編として“ちょっと昔”に発表された個性的な科学論文を取り上げる。 X: @shiropen2 米イリノイ大学アーバナ・シャンペーン校やカナダのカールトン大学などに所属する研究者らが2017年に発表した論文「A Systematic Review of Personality Trait Change Through Intervention」は、 パーソナリティー(性格)特性は治療などの介入によってどの程度変化するのかを調べた研究報告である。
■はじめに RNAがたくさん取れた時、インプット量はどれくらいにするべきか迷ったことはありませんか? GenNext® Shin-RamDA-seq® Single Cell Stranded Kitでは推奨のインプット量の範囲は10pg~1ngとなっています。 インプット量の違いでどのようなライブラリーが得られるのか、検出遺伝子数がどうなるのか、今回、GenNext® Shin-RamDA-seq® Single Cell Stranded Kitを用いて様々なインプット量からRNA-seqを実施してみました。 ■実験方法 ヒト白血病細胞株K562細胞から抽出したRNAを用いて、インプット量を10 pg~31.25 ngの範囲でライブラリー調製を行いました。 cDNA合成には、NSR Primer Set for human [Code No. NSR-101]を使用し、ライブラリーエン
ここ数年、ロボット機械学習の領域を世界的にけん引してきた米Google(グーグル)。その中枢にいた精鋭研究者30人ほどが2024年の3月、一斉にグーグルを退職し、ロボットAIのスタートアップを立ち上げたことは、この領域の人々を驚かせた。「ロボットAIで世界最高峰の企業だったグーグルをなぜ離れるのか」「一体何があったのか」と。 彼ら精鋭達は創業後の約7カ月間、黙して語らずのステルス状態を貫いてきたが、このほどその沈黙を破り、ついに最初の成果を明らかにした。その名も「π0(パイゼロ)」。 マルチモーダル型の大規模言語モデルと、最新の連続型の生成モデルを組み合わせ、「膨大な知識を生かした汎用性」と「動きの精緻さ」を兼ね備えた基盤モデル(foundation model)を作り上げた。既存のロボットAIとは比べものにならないほど動きもスムーズになり、複雑な判断が必要な長いタスクを自動で実施できる(
非哲学科の人間が哲学の諸分野の概観をつかむために最初に手に取ると良いであろう本を紹介する*1.このブログ記事を書いている人間は非哲学科であるが,哲学科の人間にも目を通してもらい,悪書が紛れ込んでいないことなどは確認してもらっている. 基本的に自分が手に取った事のない本を薦めるのは主義に反するのだが,同種のまとめがあまりなさそうなので,他の人からの推薦された本も書名だけ書く*2. 論理学 形而上学 認識論 倫理学 科学哲学 心の哲学 言語哲学 哲学史(選書中) 選書基準のようなもの コメント返し はてなブログランキング掲載 論理学 推論や根拠ある論証について扱う学問領域を論理学と言う. 哲学を勉強する上で,特に勉強したい分野にこだわりがなければ,哲学の諸分野の本を読む基礎としての「論理」について書いてある本から手を付けるのが良かろうと思われる. 現代で「論理学」と言うと,論理を分析するための
科学哲学日本語ブックガイド (最終更新 2023年12月18日) 伊勢田哲治 近年日本語でよめる科学哲学の書籍も増えてきたが、そのためどういう順番で何を読めばよいかわからないという問題も生じている。科学哲学に関する情報も最近はかなりインターネットで調べられるようになってきたが、中途半端な知識で書かれた不正確なものも多く、信頼できる書籍の重要性は以前と変わらない。 本リストに収録しているのは日本語の書籍(一部論文)のみである。英語に特に抵抗がないなら、専門外の人でもStanford Encyclopedia of Philosophyなどの英語の情報源に向かった方が効率よく科学哲学の研究動向を知ることができる。 凡例 ・紹介した中には絶版書も多いが、図書館等で利用できるだろうことも踏まえて、特に入手可能なものとそうでないものを区別はしていない。 ・科学哲学を專門としない人が読むことを想定
日本語LLMまとめ [ English | Français | 日本語 ] 日本語LLM・海外LLMのパラメータ数の推移。日本語モデルの情報は本記事、海外モデルの情報は LifeArchitect.ai の Models table を参照しています(ただし、図のスペース上一部のモデルは省略。また、海外モデルのパラメータ数は推測値を含む)。修正・追加等ありましたらお知らせ下さい。この記事は、一般公開されている日本語LLM(日本語を中心に学習されたLLM)および日本語LLM評価ベンチマークに関する情報をまとめたものです。情報は、有志により収集されており、その一部は論文や公開されているリソースなどから引用しています。 以下の点について、あらかじめご理解とご了承をお願いいたします 本記事の内容は、完全性や正確性を保証するものではありません。これらの情報は予告なく変更されることがあり、また最新
AIモデルに対して実施するベンチマークテストは、企業が自社のモデルの性能をアピールするためにしばしば利用される。だが、新たな研究によると、こうしたベンチマークテストは、設計が不十分であることが多いという。 by Scott J Mulligan2024.11.29 9 この記事の3つのポイント AIベンチマークは設計に問題、結果の再現性や指標に課題 ベンチマークの品質向上には専門家の関与や能力の適切な定義などが重要 今後のAI評価や規制には優れたベンチマークの開発が不可欠 summarized by Claude 3 人工知能(AI)の新モデルが発表されるとたいていの場合、一連のベンチマークテストで優れたスコアを出したと大々的に宣伝される。たとえば、オープンAIが5月にGPT-4oを発表したとき、その性能が複数のテストにおいて他のすべてのAI企業の最新モデルを上回ったことを示す結果が公表さ
海外営業マン @supremeeigo オフィスから個室やパーテーションを取り払ってオープンレイアウトに移行すると、対面コミュニケーションが70%「減り」、生産性が落ちると何度も実証で確かめられているのに、企業がまだオープンレイアウトに移行しようとするのは不思議ですよね pic.x.com/KhoE9IzwGe x.com/arshad_esq/sta… 2024-11-18 10:59:12 Arshad Karim @arshad_esq マイクロソフトでは個室がもらえる人が結構いたんだね。私の前職のTwitterでは本社のGeneral Counsel(法務担当役員)ですら個室は無かったから、同じ米系テック企業でもだいぶ違いますね。 x.com/kaz_kazuhisa/s… 2024-11-18 10:47:11 リンク WIRED.jp オフィスが「オープン」な設計だと、生産性が
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く