非常に高性能な画像生成AI「ImageFX(Imagen 3)」の登場です。 FLUX.1がMidjourneyと並ぶ最高峰の画像生成AIとして注目を浴び始めてから2週間もたたないうちに、新しいAI画像サービスが、なんとGoogleから登場しました。それがImageFXです。 Googleは画像生成AIの新バージョンであるImagen 3をリリースしたばかりですが、この技術を使った「ImageFX」というサービスをGoogle AI Test Kitchenでスタートしています。これが生成する人物画像がとてもリアルだというので評判です。GeminiでもImagenを使った画像生成は可能なのですが、制限が厳しく、人物を含んだ画像の生成ができなくなっています。 ▲GeminiのImagenでは人物画像が生成できない ImageFXは、テキストプロンプトを入れると、4枚の画像が生成されるという仕
3人の若い米国人エンジニアは既存の部品、既存のアルゴリズム、3Dプリンターを使用し、画像照合航法で飛行する無人機を1日で作り上げてしまい、彼らは「ウクライナ政府系ファンド、特殊部隊、地上軍から直接声がかかっている」と明かした。 参考:How A Trio Of Engineers Developed A GPS-Denied Drone For Under $500 Theseusの無人機にはウクライナ政府系ファンド、特殊部隊、地上軍から直接声がかかっている米軍はロシアや中国の妨害してくるGPS信号への対応に苦慮しているが、3人の若いエンジニアは既存の部品、既存のアルゴリズム、3Dプリンターを使用し、画像照合航法で飛行する無人機(500ドル未満)を1日で作り上げてしまい、Aviation Weekは「彼らは低コストでGPSを代替する手段があると考えている」「この無人機の開発速度は国防総省が
アイコンぬこさまシンプルな画像に特化したイラストメーカーです。 プレゼン資料や広報、ポスターに利用可能な、かわいいイラストを生成します。 以下が生成サンプルです。 まろ はげ まえ きょりかん ぬこぬこあと、今回はトーク部分をカジュアルなタッチにしていて 「ビジネスマンたちの会議のシーンのイラスト、完成したよだっちゃ!どうかな、気に入ってくれたかな? 📈👔✨」 とか 「プレゼン中のビジネスマンのイラスト、出来上がったよだっちゃ!どう?いい感じになったかな? 📊👨💼✨」 とか なんかそんなチャットボットキャラにしてみました。 いろいろ使えると思うので、工夫して使ってみてくださいだっちゃ! 下の文章、なんかおかしいだっちゃで、今気づいたんですが、GPTsのインフォメーションの表示、下の文章がおかしいですね。 「GPT-4の上限に達しました。これにより、すべてのChatGPT Plu
前回はStable Diffusionをブラウザーで利用するためのUIとして「Stable Diffusion web UI(AUTOMATIC1111版)」、「Fooocus」と共に多く使われている「ComfyUI」のインストール方法を紹介した。とりあえず画像の生成はできたので、あらためてインターフェースを詳しく見ていこう。 まずは前回の手順に従いインストールした「ComfyUI」を起動。この画面が出ていなければ「Load Default」をクリックしよう。 いくつかの四角いパーツが、カラフルなケーブルのようなもので接続されているのが見える。 ComfyUIでは配置されたそれぞれのパーツを「ノード」と呼ぶ。それぞれのノードは「モデルをロードする」「プロンプトを書く」といった機能を持っている。これらをブロックのように組み合わせて利用したい機能を構築していくのが「ノードベース」と呼ばれるCo
米イリノイ大学アーバナ・シャンペーン校と米Adobe Researchに所属する研究者らが発表した論文「Tracking Anything with Decoupled Video Segmentation」は、動画の中でさまざまな物や人を認識し分離するビデオセグメンテーション技術を提案した研究報告である。この技術は映像が再生されている間も追従し、物や人を分割し続けることができる。この技術のことを「DEVA」と名付けている。 ▲ビデオセグメンテーション手法「DEVA」の出力結果 keyboard_arrow_down 研究背景 keyboard_arrow_down 研究内容 ビデオセグメンテーションとは、動画の中の物や人を認識し、再生されても追跡してそれを分ける技術のことである。ビデオセグメンテーションは、ビデオ内のオブジェクトを分割し、関連付けることを目的としている。これはコンピュータ
本記事では Stable Diffusion の img2img で strength を変更したらどれだけ画風が変わるのか、また元絵の意匠を汲み取って残してくれるのかについて調査した。 元絵について 人物がひとりの場合 人物がふたりの場合 まとめ (2022/09/03追記) 複雑な元絵の場合 人力での修正もきちんと描けていないと引きづられてしまう (2022/09/04追記) strength に小数点2位の値を与えた場合の変化について 元絵について 元絵にはこれを使った。今回は、人物が1人の場合と2人の場合で調査することにした。 ローカル環境でのテストなので「ネットから拾ってきたモノ」を使ってもよいが、なんかのタイミングでそれが表に出てしまったら困るし、ブログに書きたいことが出てきてもそのまま使えない。基本的には img2img のテストでは自分で書いた絵を元絵にしている。 人物がひ
TwitterユーザーのGeorge Ioannidisさんが、「Twitterアカウントを確実に凍結させることができる画像を誤って作成してしまった」と報告しています。 Ioannidisさんは、「Twitterアカウントを一時的に凍結してしまうことができる抽象的な画像を誤って作成してしまったようです。ちょっと楽しくて不気味な偶然を生み出すのは、新型コロナウイルスのRNAを表現した画像です」とツイート。 I seem to have accidentally created an abstract image that reliably triggers #Twitter to suspend your account for awhile To make it a bit of a fun/creepy coincidence, the image is based on a repre
[速報]マイクロソフト、手書きのスケッチをAIでアプリ画面に手軽に変換できる「Power Apps Express design」発表。Microsoft Build 2022 マイクロソフトは現在開催中の開発者向けイベント「Microsoft Build 2022」で、ローコード/ノーコード開発ツール「Power Apps」の新機能として、手書きのスケッチやPDFのフォーム画面、Figmaのデザインファイルなどを元に、AIがアプリケーションの画面作成を支援してくれる「Power Apps Express design」を発表しました。 公開された動画を元に、Power Apps Express designの機能を見ていきましょう。 Power Apps Express designでは、画面スケッチをキャプチャするとAIがUIコンポーネントを認識します。
要点 最先端機械学習モデル「Vision Transformer」に基づく、新たなレンズレスカメラの画像再構成手法を提案 提案した画像処理技術は高速に高品質な画像を生成できることを実証 小型・低コストかつ高機能であるため、IoT向け画像センシング等への活用に期待 概要 東京工業大学 工学院 情報通信系の潘秀曦(Pan Xiuxi)大学院生(博士後期課程3年)、陈啸(Chen Xiao)大学院生(博士後期課程2年)、武山彩織助教、山口雅浩教授らは、レンズレスカメラの画像処理を高速化し、高品質な画像を取得できる、Vision Transformer(ViT)[用語1]と呼ばれる最先端の機械学習技術を用いた新たな画像再構成手法を開発した。 カメラは通常、焦点の合った画像を撮影するためにレンズを必要とする。現在、IoT[用語2]の普及に伴い、場所を選ばず設置できるコンパクトで高機能な次世代カメラが
レーザーで同時生成した中性子とX線で瞬間撮影した画像。左:実際のサンプル位置。中:中性子撮影画像。炭化ホウ素も写っている。右:X線撮影画像。軽い炭化ホウ素は写っていない(阪大レーザー研・余語准教授提供) 大阪大学レーザー科学研究所の余語覚文准教授らの研究チームは、レーザー光を使って中性子とX線を同時に生成し、試料の透過画像を瞬間撮影する技術を開発した。2種類の画像を比較することで物質の種類を識別できる。極短パルスにより、10万分の1秒で撮影できる。金属配管内の水や油の流れ、ロケットエンジンの液体水素燃料の挙動など、可視光やX線では捉えられなかった高速現象を撮影できるようになる。 X線は金属など重い物質の透過画像を撮影できるが、水素といった軽い物質は透過してしまう。一方、中性子は水素に対し感度が高く、水や燃料、生体分子を可視化できるため、両手法による同時撮影が望まれていた。 研究チームは阪大
Intelからニューラル・ネットワークで解析する顔認証デバイス。支払いやATM、空港ゲートなどを非接触にできる2021.01.08 14:00 岡本玄介 手ブラで顔面ペイが実現したらイイなぁ。 コンピューターやプロセッサーで知られるintel(インテル)が、顔認証専用デバイス「Intel RealSense ID Solution F455」を発表しました。 これはクレジットカードより小さく、ブレスミントの「フリスク」の容器くらいのサイズ感。なのにアクティヴ深度センサーとニューラル・ネットワークが採用されているため、合致率は99.76%で、写真や動画やマスクを装着するなどによるなりすましを誤認するのは1/100万と謳っています。 毛むくじゃらの人が出家しても認識できるまずあらかじめ登録した顔のデータは、数秒で暗号化されて処理されます。そして認証にかかるのはわずか1秒未満で、地上55cmの位
SMITH&MOTORS株式会社は、東大発AIベンチャーTRUST SMITH株式会社の関連会社として2020年12月に設立されました。 その後SMITH&MOTORSは、TRUST SMITHが2020年8月に開発に成功していた「ドライブレコーダー映像から個人情報を取り除くAI(マスキングAI)」のモザイク精度の向上に成功。2021年3月にマスキングAIの代理店向け販売を開始しています。そしてこのたび、映像を取り扱うあらゆる企業へ向けたマスキングAIのランディングページを公開しました。 高精度かつ高速なマスキング処理マスキングAIは、写真や映像から個人の顔や表札、車のナンバープレートといった個人情報を自動検出し、該当箇所をモザイクのように自動で消し込むことが可能。昨今のプライバシー保護が重要視される流れの中で映像を扱う企業が抱える課題の解決に貢献してくれそうな技術です。 マスキングAIの
Uknow.AI(旧名CheckMath)は、最新のAI技術とChatGPTを融合した無料のAI学習アプリです。学習の道のりで強力なサポートを提供します。どの学年に属していても、どの教科を学んでいても、AIとのチャットや写真で質問することにより、簡単に支援を得ることができます。数秒で超高速のレスポンスを提供し、詳細な解説を素早く検索するのを助けます。 写真で計算問題をチェックし、正しさを精確に判断し、どこが間違っているのかが一目瞭然になります。 【先端の人工知能】 独自に開発した最新のAIと大型言語モデルを統合して、優れた解答の質と精度を提供します。これにより、学習がより効率的になるだけでなく、学習過程に前例のない便利さをもたらします。 【24/7のAI解答】 写真を撮るのか、文字を入力して質問するのかに関わらず、Uknow.AIはすぐに問題を理解し、解答をステップバイステップで提供します
「そらとぶあざらしさん」を遊んで頂くと、大体の温度感がご理解いただけるかと思います。 制限がされたページ今年の1月10日に、noteタイトルにもある「遺伝的アルゴリズムで最高にエッチな画像を作ろう!」というページを公開しました。 内容はタイトルの通りです。 ランダムに生成された2枚の画像から「エッチ」な方を選んでいくと、アルゴリズム学習によってだんだんとエッチな画像になっていくというものです。 遺伝的アルゴリズムで最高にエッチな画像を作ろう! (エッチな画像が見れるとは言っていない) より このページには、筆者のささやかな収入源として、GoogleAdSenseの広告を貼っていました。 GoogleAdSenseとは、大企業であるGoogleが運営している個人クリエイター向けの広告プログラムです。 AdSenseのポリシーとして、「性的に露骨なコンテンツ」(Sexually explici
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く