[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

タグ

ブックマーク / xtech.nikkei.com (43)

  • GPT-4oの画像認識を用いた「AI売り子」、Gateboxが東京ゲームショウ2024で展示

    AI人工知能)を活用したコミュニケーション製品を手掛けるGateboxは、東京ゲームショウ2024(2024年9月26~29日、幕張メッセ)で小売店向けAI接客サービス「AI売り子」を展示している。同サービスは9月25日に発表した。91言語に対応しており、画像認識による客の呼び込みや商品説明を実施できる。 AI売り子は米OpenAI(オープンAI)のマルチモーダルの大規模言語モデル(LLM)「GPT-4o」を利用し、カメラによって得られた映像から画像認識技術で状況を判断する。カメラに映った客の特徴を認識し、客に合わせた呼び込みや商品の紹介を実施できる。実際の展示では「ジャケットを着たお姉さん」のように客の服装や性別を認識した呼びかけをしたり、目の前に置かれたドーナツを紹介したりしていた。キャラクター設定や商品情報などはGateboxが店舗に合わせて調整するだけでなく、店舗側でも設定できる

    GPT-4oの画像認識を用いた「AI売り子」、Gateboxが東京ゲームショウ2024で展示
    NAT
    NAT 2024/09/28
    カメラに映った客の特徴を認識。展示では「ジャケットを着たお姉さん」のように客の服装や性別を認識した呼びかけをするとのこと。 サービスは月額2万円から利用できるとか。
  • みずほ銀行窓口業務ストップの真相、DC切り替えをためらい障害が長期化

    みずほ銀行で2021年8月20日、営業店の窓口業務が全面停止するトラブルが発生した。前日の19日午後8時53分ごろに営業店端末と勘定系システムをつなぐサブシステムで、データベース(DB)サーバーがディスク装置の故障をきっかけに停止したためだ。待機系DBサーバーへの切り替えも失敗、副データセンター(DC)に処理を切り替えた。副DCへの切り替えに着手するまで11時間超を要し、業務開始に間に合わなかった。 みずほ銀行で2021年8月20日、全463店舗で営業店端末や店頭のタブレット端末が使用不能になった。午前9時の開店から午前9時45分までは全ての店頭取引ができなくなり、その後も午前11時58分まで融資や外国為替(外為)の一部取引ができなくなった。営業店端末などと勘定系システム「MINORI」をつなぐサブシステム「業務チャネル統合基盤」が前日の8月19日午後8時53分ごろに停止したためだ。 業務

    みずほ銀行窓口業務ストップの真相、DC切り替えをためらい障害が長期化
    NAT
    NAT 2021/09/25
  • VTuber「8000人」殺到、指の動きを再現する凄腕副業エンジニア

    VRエンジニア。1992年生まれ、栃木県出身。筑波大学大学院修了後、DeNA(ディー・エヌ・エー)に入社。XR事業を手がけるhelo(ハロー)を経て、SHOWROOMのVRエンジニア副業としてLuppetの開発を進める。エンジニアを目指したきっかけは、ゲームとものづくりが好きだったから。別名、ねぎぽよし。(撮影:加藤 康) 動画配信サービスYouTubeで活動するバーチャルタレント「VTuber(ブイチューバー)」。3DCGなどのアバターを動かすVTuberに欠かせないのが、仮想空間上で体の動きを再現するモーションキャプチャー技術である。同技術において、VTuber関係者の間で人気を博し、8000以上のライセンスを提供するソフトウエアがある。SHOWROOM 事業部 アライアンス部 プロダクトG 兼 ラペットテクノロジーズ 代表の根岸匠が開発する、「Luppet(ラペット)」だ。 Lup

    VTuber「8000人」殺到、指の動きを再現する凄腕副業エンジニア
    NAT
    NAT 2021/06/28
  • バーチャルDJは人を超えるか、出演者も演出家もAIにお任せ

    コロナ禍で音楽ライブのオンライン化の模索が続く中、バンダイナムコ研究所(東京・江東)が3D CGキャラクターとAI人工知能)を駆使し、バーチャルなDJ(ディスクジョッキー)を生み出す取り組みを進めている。DJに必要とされる複数の曲をスムーズにつなぐミックス操作、サウンドエフェクト操作、スピード操作などと、キャラクターの動きをすべてコンピューターで実現する。 同社が究極的に狙うのはバーチャルDJのみならず、照明、音響、演出、演奏などステージを丸ごとコンピューターで創り出す世界だ。バーチャルDJはその第一歩と位置づける。 観客を飽きさせないDJ 同社がDJシステムとして開発しているのは「BanaDIVE AX」と呼ぶシステム(図1)。DJのように同システムで、複数の楽曲のつなぎやエフェクトを駆使し、聞き手を盛り上げることができる。ゲーム向けに開発しているAIを利用し、キャラクターの動き、演出

    バーチャルDJは人を超えるか、出演者も演出家もAIにお任せ
    NAT
    NAT 2020/09/16
    同社が究極的に狙うのは、DJのみならず、照明、音響、演出、演奏などステージを丸ごとコンピューターで創り出す世界だとか。VRでは、照明や演出は基本プログラム制御のようなので、そういう世界はVRで先に来そう。
  • 進化する音声合成技術は声優の敵か味方か、大手事務所トップが本音で語る

    音声合成技術の進化が目覚ましい。人間に近い“自然な発話”が可能になったことで、用途が急速に広がった。歌声合成技術や声質変換技術といった派生技術も実用化に向けた動きが進んでいる。 今の音声合成技術では、声優などによる良質な収録音声が欠かせない。声をなりわいとする声優からすると、音声合成技術の普及は声優から「仕事を奪う」リスク要因ともいえる。にもかかわらず、音声合成技術の活用に積極的なのが大手声優事務所の81プロデュースだ。その狙いについて、同社代表取締役社長の南沢道義氏に聞いた。(聞き手は高野 敦、東 将大=日経 xTECH) なぜ音声合成技術の活用に積極的なのですか。 数多くの人気声優や実力派・ベテラン声優が所属する81プロデュース、およびアニメ関連の音響制作や外国映画の日語版制作を手掛けるハーフ・エイチ・ピー・スタジオの代表を務め、多方面から声優、俳優を支援する。さらに、一般社団法人デ

    進化する音声合成技術は声優の敵か味方か、大手事務所トップが本音で語る
  • 音声合成の強みは「永遠に残せること」、エンジニア気質の声優・小岩井ことり氏が分析

    音声合成技術の進化が目覚ましい。しかし、それを支えているのは声優などによる良質な収録音声だ。声をなりわいとする声優にとって、音声合成技術の普及は「仕事が奪われる」リスク要因でもある。 その音声合成技術を、現場の声優はどう見ているのか。音声合成ソフトウエア「ガイノイドTALK」や歌声合成ソフトウエア「VOCALOID」、声質変換ソフトウエア「リアチェンvoice」などに声を提供し、自身でも音声合成技術を活用しているピアレスガーベラ所属声優の小岩井ことり氏に聞いた。同氏は作詞や作曲なども手掛ける。(聞き手は東 将大、高野 敦=日経 xTECH音声合成技術の利点は何だとお考えでしょうか。 ピアレスガーベラ所属。TVアニメ「のんのんびより」宮内れんげ、「THE IDOLM@STER ミリオンライブ!」天空橋朋花などの声を担当する一方、TBSラジオで毎日流れるジングルの作詞作曲編曲を務めるなど作

    音声合成の強みは「永遠に残せること」、エンジニア気質の声優・小岩井ことり氏が分析
  • 声優や歌手の仕事は増えるか奪われるか、音声合成技術が驚異の進化

    音声合成技術の進化によって、これまで一部に限られていた用途が幅広い産業に拡大している。さらに、音声そのものや音声合成を流通させるプラットフォームビジネスの登場、音声に関する権利の確立といった動きも出てきている。 用途の拡大については、抑揚や感情表現など、人間に近い“自然な発話”を実現したことが後押しになっている。従来の音声合成技術による合成音声は、「無機質」「機械が話しているような声」と形容されるように抑揚や感情表現などに乏しく、用途もコールセンターの自動応答などに限られていた。だが、「人間が話しているような声」に近づいたことで、最近はコミュニケーションロボットやデジタルサイネージ、テレビ/ラジオ放送、公共交通機関の各種案内など、多様な分野に普及しつつある。 さらに、音声合成技術に関連した技術として、楽曲(歌詞や音階などの情報)に合わせた歌声を生成する歌声合成技術や、音声を別人のものに変え

    声優や歌手の仕事は増えるか奪われるか、音声合成技術が驚異の進化
    NAT
    NAT 2019/07/16
    音声合成技術の進化をシャープ「ロボホン」を事例に紹介。機能と会話内容を更新し続けるため、収録音声ではなく、HOYAの音声合成技術を使用。歌う機能にも対応し、プロの歌手の歌声を声質変換している。
  • 世田谷区の通知書類に「平成3元年」と誤表示、改元前に早くもトラブル

    東京都の世田谷区役所が2019年3月上旬に区民に送った通知書類に、日付が「平成3元年」となるミスがあったことが日経 xTECHの取材で分かった。区は2019年3月11日から順次、おわびの文書を送付している。「実害はない」(世田谷区)といい、原因は改元のシステム対応と別だったが、改めて和暦をシステムで取り扱う際に慎重さが求められることを示した。 ミスがあったのは私立幼稚園に通園する子供を持つ保護者に補助金を交付する通知書類である。通知書類を起票した日付と補助金の振込日の2カ所について、「平成31年」と印字すべきところを「平成3元年」と印刷した。対象世帯に約1万通を発送したという。

    世田谷区の通知書類に「平成3元年」と誤表示、改元前に早くもトラブル
    NAT
    NAT 2019/04/13
    ソフトウェアのロジックがしょうもないのもあるが、「テストで使ったデータがダミーデータだったため、バグが表面化せず、発見を漏らした」がダメすぎる。本番データ(の一部)を使ってテストしろよ。
  • あの人気アニメの変声機がディープラーニングで現実に

    人気推理アニメ「名探偵コナン」の重要な探偵グッズとして登場する「蝶ネクタイ型変声機」も夢ではない――そんな技術が登場した。東京大学大学院情報理工学系研究科システム情報学専攻の猿渡研究室は、DMM.comと進める社会連携講座において、リアルタイムで別人の声に変換できる音声変換システムを開発した。日音響学会が開催した「2019年春季研究発表会」(2019年3月5~7日、電気通信大学)で発表した。 従来は、変換処理に時間がかかるためリアルタイムでの変換は難しく、ボイスチャットやライブ配信などリアルタイム性が求められる用途での活用は困難だった。事前に録音した音声を変換する手法が一般的だった。そのため、今回のシステムでは、DNN(Deep Neural Network)を用いた独自の変換処理により遅延を小さく抑え、リアルタイムでの変換を実現したという。

    あの人気アニメの変声機がディープラーニングで現実に
    NAT
    NAT 2019/03/14
    東京大学の猿渡研究室は、DMM.comと進める社会連携講座において、リアルタイムで別人の声に変換できる音声変換システムを開発。DNNを用いた独自変換処理により遅延を抑え、従来難しかったリアルタイム変換を実現。
  • キャラクタービジネスに新展開、VRやARのライブが続々登場

    (出所:バンダイナムコスタジオ)(C)INCS toenter Co.,ltd. All rights reserved. (C)Sony Music Labels Inc. All rights reserved. 現在、キャラクターを利用したイベントには大きく2種類ある。1つは、仮想空間にキャラクターが存在し、参加者がVR用ヘッドマウントディスプレー(HMD)を装着して楽しむVRのイベントである。もう1つは、現実空間にキャラクターを呼び出すかのように、劇場などの施設でキャラクターをスクリーンや透過ディスプレーなどに投影して楽しむARのイベントである。 VRイベントが盛り上がるきっかけとなったのは、「バーチャルYouTuber(VTuber)」と呼ばれる、主に動画配信サイトを活動の場とするデジタルキャラクターだ。VTuberは、実在するアーティストと異なり物理的な身体を持たない。従来は、

    キャラクタービジネスに新展開、VRやARのライブが続々登場
    NAT
    NAT 2018/08/22
    仮想空間にキャラクターが存在するVRイベントと、現実空間にキャラクターを呼び出すARイベントの2つを軸に、数千人規模のVRイベントが開催できるcluster.や、ARイベントでコール&レスポンス可能なBananaCASTを紹介。
  • 研究者の頭脳と時間を、違うことに使いすぎている

    新著『物理学者の墓を訪ねる ひらめきの秘密を求めて』(日経BP社)で偉大な物理学者たちの足跡をたどった京都大学大学院総合生存学館(思修館)教授の山口栄一氏(イノベーション理論、物性物理学)が、現代の“賢人”たちと日の科学やイノベーションの行く末を考える企画。 前々回、前回に続き、東京大学宇宙線研究所長の梶田隆章氏との対談の模様を伝える。最終回となる今回は、科学に対する国や市民の視線をテーマに据え、科学立国と言われた日再興に向けた方策を探った。(構成は片岡義博=フリー編集者) 定期的なカンフル剤注射 山口 物理学は誰も知らないことを見つけていく学問で、要するに未踏領域に挑戦する学問です。梶田さんがいらっしゃるこの宇宙線研究所、カミオカンデ、スーパーカミオカンデは、いわば「ニュートリノ物理学」という新しい物理学を切り開いてきました。その成果によって、小柴さんと梶田さんがノーベル賞を取られ

    研究者の頭脳と時間を、違うことに使いすぎている
    NAT
    NAT 2017/06/25
    メモ:「ムダを省く」という掛け声により、研究に注ぐ力が補助金の申請書に注がれてる。科学だけでは答えることができず社会が決めるべき問題「トランスサイエンス問題」。
  • ついに歌い始めた、シャープのロボット掃除機

    シャープは、音声合成技術「ボーカロイド」 を用いて「歌う」ロボット型掃除機「COCOROBO」を「CEATEC JAPAN 2016」(2016年10月4日~7日、幕張メッセ)に参考出展した。従来の会話機能に、ヤマハと共同開発した「ボーカロイド・ライブラリー」を用いて「歌う」機能を追加する。今回はあらかじめセットした楽曲のみを歌うが、今後はユーザーが自作した曲をCOCOROBOが歌えるようにするという。

    ついに歌い始めた、シャープのロボット掃除機
    NAT
    NAT 2016/10/09
    シャープによると、COCOROBO購入者は10代から70代までと幅広く、男女比もおよそ6対4で大きな差はない。COCOROBOを「ひっそり溺愛しているユーザーが多い」とか。
  • ワンランク上に行く、図解の鉄則と応用テクニック

    ビジュアル化のテクニックその2 次に3次元表現やビジュアル要素を活用して,伝えたい内容をより強調する,説得力のある図を作る方法を考えてみよう。例題は「単に稟議りんぎ書を電子化して回覧するだけでは,十分な効果は見込めない」というテーマ。紙の稟議書回覧にムダが多いことを示すために,さまざまなバリエーションに展開してみる。 2015.10.08 ビジュアル化のテクニックその1 グラフを目立たせる表現の1つに,3次元化がある。図25は,「進出企業数」と「労働者数」という2種類の数値データを持つ棒グラフと折れ線グラフを3次元化したものだ。このようにグラフを3次元化して重ねる表現は,数値の大まかな変化を伝える点で効果が大きい。しかし数値を正確に伝えたい時には,逆効果になること… 2015.10.07

    ワンランク上に行く、図解の鉄則と応用テクニック
  • 「新規事業」失敗の教科書

    クラウド技術やビッグデータ、マシンラーニングといったIT技術革新をトリガーにした新規ビジネスが世界中で注目を浴びています。ドイツ政府はIndustry 4.0という政策を発表し、国を挙げて製造業の競争力強化を図ろうとしています。また米国では「Fintech(フィンテック)」という名前で金融サービスに関するスタートアップベンチャーがいくつも生まれてきました。 日でもこの大波に遅れずに乗ろうという機運が高まっています。「Fintechで新規事業を手掛けろ!」と、社長から号令がでている企業も多いのではないかと思います。 ですが、こういう動機で始める「新規事業」のほとんどは失敗する、と私は思います。バブル全盛期、80年代後半から90年代のはじめにかけて、コンサルタントとして多くの大企業の新規事業プロジェクトが失敗する様子を見てきたからです。その多くがバブル崩壊とともに大企業に財務的、心理的な傷跡

    「新規事業」失敗の教科書
  • 「学生がグーグル、アップルに流出」を嘆く日本、「なぜ退屈な企業に」と驚く米国

    ITベンダーの経営者、コンピュータサイエンスを教える教育関係者、そして行政のIT関連の政策担当者が共通に心配していることがある。ITを学ぶ超優秀な若者が日IT業界に就職せず、グーグルやアップルなど“光り輝く”大手ITベンダーの熱烈ラブコールを受けて米国に行ってしまうことだ。いわば若い頭脳、若い才能の国外流出である。 確かに、この件は私も心配だ。少子高齢化の長きにわたる進行が避けられない日の状況においては、企業が従業員の頭数や客の頭数に依存した商売から脱却して、より付加価値の高いビジネスに移行できるかどうかが、日の将来を決める。そして、ビジネスのイノベーションのためにITが不可欠であることも論を待たない。なのに、その中核を担うはずの若者が日を去ってしまう。 当に大変だ。そんな話をあるITベンダーの経営者にしたら、「あんたが極言暴論なんかで、日IT業界を悪く書いたりするか

    「学生がグーグル、アップルに流出」を嘆く日本、「なぜ退屈な企業に」と驚く米国
    NAT
    NAT 2015/06/22
    優秀な技術者は起業するという発想の米国の技術者から見ると「日本の優秀な若者はなぜ、(グーグル、アップルといった)そんな退屈な大手ベンダーに就職するのか」という感覚らしい。
  • [優良賞]ミク語り、遠隔制御の顕微鏡、LEGOを拡張したケース

    今回は「みんなのラズパイコンテスト」の三つの受賞作品を紹介します。優良賞を受賞した持田 宏平さんと高田 勇輝さん(大学院生)、杉山 正芳さんの作品です。 [優良賞]持田 宏平さん 管楽器を吹きながら弾き語りができる 「ミク語り」 さまざまある楽器のうち、ギターやピアノは「弾き語り」ができるのが特徴です。演奏者が演奏しながら、その音色に合わせて歌うことができます。一方トランペットやトロンボーンといった管楽器は、楽器を吹きながら歌うことはできません。作品「ミク語り」は、そうした管楽器でも、演奏に合わせて歌を歌えるようにする、つまり弾き語りならぬ「吹き語り」をできるようにするものです。楽器を吹いている奏者自身が歌うことはできないので、その名の通り、ボーカロイドの初音ミクが歌います。 管楽器にマイクを装着し、マイクから入力された音声をラズパイに入力します(図1)。この入力データから音程を判定。そ

    [優良賞]ミク語り、遠隔制御の顕微鏡、LEGOを拡張したケース
    NAT
    NAT 2015/04/15
    管楽器を吹きながら弾き語りができる「ミク語り」。管楽器にRaspberry Piに接続したマイクを装着し、音程に従ってMIDIメッセージを出力。それをポケットミクに入力して歌わせる仕組み。
  • 「プログラマの役に立つものを提供していきたい」、情報共有サービス「Qiita」の挑戦

    「Qiita(キータ)」というサービスをご存じだろうか。プログラミングの話題に特化した技術情報共有サービスだ。プログラミングに役立つ技術知識を持っているプログラマがその知識を投稿することで、他のプログラマと共有できる。投稿された知識は、会員でなくても閲覧可能だ。会員登録することで、知識を投稿したり、気に入った投稿を自分の「ストック」に登録したりできる。その投稿が他の会員からストックされた数が、そのまま人気を表すことになる。Twitterのように会員をフォローすることもできる。

    「プログラマの役に立つものを提供していきたい」、情報共有サービス「Qiita」の挑戦
    NAT
    NAT 2013/11/29
    当初はstack overflow的なプログラマー向け質問サイトを作ったが、質問が集まらなかったので、情報共有サイトに方向変換したとのこと。あとでチェックしてみよう。
  • 誤発注裁判が改めて問う「バグは重過失か」

    「東京証券取引所に重大な落ち度があることは、火を見るより明らかです」。2013年3月18日、東京高等裁判所での第一回口頭弁論。みずほ証券の代理人である岩倉正和弁護士は、東証の株式売買システムに潜んでいた誤発注を取り消せないバグの概要を説明する大型パネルを法廷内に持ち込み、25分にわたって熱弁を振るった。 対する東証代理人の山田和彦弁護士は終始落ち着いた口調で「合理的信頼性を有するシステムを提供できていれば、たとえバグが一つあったとしても、債務不履行には当たりません」と述べ、13分ほどで弁論を終えた。同日、裁判は結審した。 みずほ証券と東証による株誤発注裁判の控訴審は、両社がソフトウエア工学上の論争を戦わせる異例の展開になった(図1)。

    誤発注裁判が改めて問う「バグは重過失か」
    NAT
    NAT 2013/04/05
    「バグは重過失か」という一般論にするのは良くないと思う。せめて「今回のバグを見逃したのは重過失か」「今回のバグが見つかるテストの未実施は重過失か」にしないと。
  • タブレットに新潮流、7型NexusがiPadをついに逆転

    調査会社のBCNは2013年1月16日、2012年のデジタル家電の販売状況を発表した。秋に登場したエイスーステック・コンピューターの「Nexus 7」をはじめとする7型タブレットが人気を獲得して急拡大する反面、アップルの「iPad」が絶対的なシェアを誇っていた10型クラスのタブレットが一気に縮小していることが分かった。 パソコンは、Windows 8モデルへの移行がようやく進み始める BCNの道越一郎氏は、2012年のデジタル製品の販売は全体に低調だったものの、夏以降にやや回復の兆しが見え始め、政権交代に沸いた2012年12月はその傾向が顕著になったという。だが「格的な回復はもう少し先」とみる。 2012年秋に新OS「Windows 8」がリリースされて盛り上がるかと思われたパソコンだが、Windows 8モデルが登場しても売れ行きはしばらく低調に推移した。2012年12月末になって売れ

    タブレットに新潮流、7型NexusがiPadをついに逆転
    NAT
    NAT 2013/01/19
    iPad miniやNexus 7のような7インチタブレットが人気らしい。2012年12月にタブレット売り上げ全体のうち7割を占めたとか。
  • Ubuntu搭載スマートフォンが2013年末までに登場へ

    Linuxディストリビューション「Ubuntu」を主導する英Canonicalは現地時間2013年1月2日、モバイル版Ubuntuを発表した。パートナー企業と協力し、2013年末までにモバイル版Ubuntuを搭載したスマートフォンのリリースを目指す。 モバイル版Ubuntuは、スマートフォンのエントリー機種向けに高速で美しいインタフェースを提供する一方、モニターやキーボード、マウスとドック接続することで、パソコンと同様の体験を実現するとしている。 スクリーンの4辺に割り当てた親指操作機能により、素速いコンテンツの特定やアプリケーション間の切り替えが行える。ユーザーがコンテンツに集中できるように、コントロールオプションは必要なときのみ表示する。音声命令とテキスト命令に対応し、ネイティブアプリケーションおよびHTML5アプリケーションをサポートする。 また、Android Board Supp

    Ubuntu搭載スマートフォンが2013年末までに登場へ
    NAT
    NAT 2013/01/05
    Ubuntuのモバイル版か。どこかのメーカーが搭載して売るのかな?