NVIDIAがRTX 3050と同じGPUを搭載するRTX A1000とRTX A400を発表。ロープロファイルかつシングルスロットで最強GPUに? NVIDIAではロープロファイルGPUとしてGeForce RTX 4060やその前にはRTX A2000などが発売され、これらのグラフィックカードがロープロファイル規格を満たすグラフィックカードとして非常に高い性能を持っていました。 しかし、これらグラフィックカードはロープロファイルではあるものの、2スロットで小型かつ薄型デスクトップには入らないケースもありましたが、NVIDIAではAmpere GPUを搭載したロープロファイルかつシングルスロットのRTX A1000とRTX A400の2モデルを発表しました。 NVIDIA RTX A1000およびRTX A400はRTXシリーズとしてリリースされているため、ゲーミング向け製品ではありませ
最先端のAI技術を利用して自動で動画を高画質化・フレーム補間・手ぶれ補正することができるソフトウェア「Winxvideo AI」は、動画だけでなく画像の高画質化も可能です。低画質な画像を鮮明に補正することができるということで、Winxvideo AIを使っていろんな画像を高画質化しまくってみました。 【無料】Winxvideo AI - 最高の動画、写真高画質化・修復&動画変換ソフト|無料体験 https://www.winxdvd.com/winxvideo-ai-ja/index.htm Winxvideo AIをインストールするには、上記の公式サイトにアクセスしてトップにある「無料ダウンロード」ボタンをクリック。 ダウンロードしたインストーラーをダブルクリックで起動。 「インストール」をクリック。 数秒でインストールが完了するので、「今すぐ起動」をクリック。 「後で通知する」をクリッ
ではそもそも“1bit”とは何が1bitなのか、どうして1bitになるとGPUが不要になるのか。LLMでGPUが不要になるとどんな世界が訪れるのか。オーダーメイドによるAIソリューション「カスタムAI」の開発・提供を行うLaboro.AIの椎橋徹夫CEOに聞いた。 プロフィール:椎橋徹夫 米国州立テキサス大学理学部卒業後、ボストンコンサルティンググループに参画。消費財や流通など多数のプロジェクトに参画した後、社内のデジタル部門の立ち上げに従事。その後、東大発AI系のスタートアップ企業に創業4人目のメンバーとして参画。AI事業部の立ち上げをリード。東京大学工学系研究科松尾豊研究室にて「産学連携の取り組み」「データサイエンス領域の教育」「企業連携の仕組みづくり」に従事。同時に東大発AIスタートアップの創業に参画。2016年にLaboro.AIを創業し、代表取締役CEOに就任。 ──まず、1bi
AIの開発にはGPUやAIアクセラレータからなる大規模な計算資源が必要です。AI企業Anthropicのダリオ・アモデイCEOはAIモデルの学習費用が今後数年で約100億ドル(約1兆5400円)に達すると推測しています。 Transcript: Ezra Klein Interviews Dario Amodei - The New York Times https://www.nytimes.com/2024/04/12/podcasts/transcript-ezra-klein-interviews-dario-amodei.html 大規模言語モデルやマルチモーダルAIモデルの学習には、大量のGPUやAIアクセラレータが必要です。NVIDIAやAMD、Intelといった半導体企業はAIの学習を効率的に実行できるチップの開発を進めていますが、それらのAI特化チップは性能の高さと引き換
負荷を抑えて高品質? スマホゲームのグラフィックスを進化させるためにゲームエンジン「Frostbite」が取り組む「FP16化」とは ライター:西川善司 2024年3月に行われたGDC 2024で,「FP16 Shaders in Frostbite」という一風変わったテーマを掲げていたセッションがあった。 簡単に言えば,Electronic Arts(以下,EA)の独自開発ゲームエンジン「Frostbite」で,16bit浮動小数点数(FP16)を徹底活用して性能を改善できるか検討したというものだ。 セッションを担当したAlexis Griffin-Lira氏(Software Engineer,Frostbite. EA)。Frostbiteエンジン開発チームの一員だ 近代ゲームグラフィックスでは,頂点シェーダが扱うジオメトリ(幾何学)的な演算において,単精度と呼ばれる32bit浮動小
3行まとめ 米国のスタートアップであるX-Siliconは、非常に面白い構想と展開を明らかにしました。それは、CPUとGPUの両方の処理を行えるアーキテクチャ「C-GPU」です。 C-GPU コアの構造 動作 オープン 関連リンク C-GPU 今回明かされたのは「C-GPU」(Unified Compute Graphics Engine)の計画です。このC-GPUは、GPUの命令もCPUと同じ命令にしてしまって、単一のコアでCPUとGPU両方(あるいはその他のアクセラレータ全て)の処理を行えたら良いことあるやん。というものになります。つまり、C-GPUアーキテクチャでのコアは「何でも屋」になるわけです。あるいは、CPUにもなれる、分割可能なFPGAとしても正しいでしょうか。 具体的に説明します。現在普及しているシステムにおいて、CPUとGPUは別々のアーキテクチャとして設計されています。
米Metaは4月10日(現地時間)、AIトレーニング高速化のためのカスタムチップ「MTIA」(Meta Training and Inference Accelerator)の第2世代を発表した。 昨年5月に発表したMTIAは、MetaのFacebookやInstagramでのランキングおよび広告レコメンデーション機能などで最適に動作するよう設計されている。AIのトレーニングを効率化し、推論を容易にするのが目的だ。 第2世代のMTIAは、先代のコンピューティング帯域幅とメモリ帯域幅を2倍以上に拡張し、「ユーザーに高品質の推奨を提供するランキングと推奨モデルを効率的に提供するよう設計されている」という。初期のテスト結果では、4つの主要モデルで先代と比較して性能が3倍向上した。 一般的なGPUより大容量のSRAMを使うことでバッチサイズが制限されていても十分なコンピューティングを提供できる。
生成AI以前と以後で、会社のあり方は決定的に変化していくのだと思う。 たとえば、昨日はとある会議で、「この(AI)サービスの原価はいくらか」という議論が沸き起こった。 AIサービスなのだから、AIの利用料くらいしかかからないかというとそうでもない。実際、AIを動かすためにはAIそのものにかかるお金以外の人件費がかかる。誰かに売る人の人件費や、システム開発のための人件費や、サポートのための人件費だ。ただ、AIサービスの場合、人件費を極限まで最小化することができる、という点が決定的に違う。 また「AIの利用料」も、「APIの利用料」なのか、ベアメタルサーバーの月額利用料なのか、それとも自社に持っているGPUマシンの電気代なのか、という議論のポイントがある。 あまり多くの人は語らないことだが、実は起業には再現性がある。 つまり、一度でも事業をうまく立ち上げたことがある経験を持つ人は、次も事業をう
LLM training in simple, pure C/CUDA. There is no need for 245MB of PyTorch or 107MB of cPython. For example, training GPT-2 (CPU, fp32) is ~1,000 lines of clean code in a single file. It compiles and runs instantly, and exactly matches the PyTorch reference implementation. I chose GPT-2 as the first working example because it is the grand-daddy of LLMs, the first time the modern stack was put toge
はじめに 下記の素晴らしいGLSLを使ったシェーダーアートのチュートリアル動画の内容をWebGPUでやってみたのでその覚書です。WebGLは以前少しだけ齧ったことがありましたがWebGPUについては完全に知識ゼロなので入門のお題としてやってみた感じです。チュートリアル動画ではShadertoyを使っておりフラグメントシェーダーに記述する部分のみの解説なので、そもそもフラグメントシェーダーを使ってブラウザで描画させるまでの工程も含めてWebGPUで再現してみるという感じです。自分も完全に理解できているわけではないのでおかしい部分があるかもしれませんがご容赦ください。またWebGPUはまだWorking Draft(草案)段階なので今後いろいろと変更される可能性があることにも注意が必要です。 実際に作ったもの リポジトリ codesandbox 実装について ざっくりとした全体の作りとしては四
世界有数の資産運用会社が、人工知能(AI)の次の勝ち組を米国外に探そうとしている。 AIに対する世界的な熱狂を背景に米半導体大手エヌビディアの株価は1年足らずで3倍になり、半導体企業を対象とする米国の主要指数であるフィラデルフィア半導体株指数は50%上昇。そうした中、投資家はより良いバリューとより多くの選択肢を求めて新興国市場に注目している。 米ゴールドマン・サックス・グループの資産運用部門は、特に冷却システムや電源といったAIサプライチェーンの構成要素を製造する企業への投資を模索していると説明。JPモルガン・アセット・マネジメントは、従来の電子機器メーカーの中でAIのリーダーへと変貌しつつある企業を選好。またモルガン・スタンレーでは、非テクノロジー分野の事業モデルをAIで再構築している企業に賭けている。
NVIDIA製グラフィックボードのドライバーをインストールすると、GeForce Experienceや物理演算エンジンなどのコンポーネントもインストールされます。しかし、ドライバー本体以外のコンポーネントは人によっては不要なもので、無駄にストレージを圧迫したりシステムに負荷をかけたりする煩わしい存在になりがちです。フリーソフトの「NVCleanstall」を使えば、あらかじめインストールしたいコンポーネントだけを選択した状態でドライバーのインストールが可能とのこと。めちゃくちゃ便利そうなので、実際にNVCleanstallを使ってドライバーをインストールする手順をまとめてみました。 NVCleanstall - NVIDIA Driver Customizer https://www.techpowerup.com/nvcleanstall/ ・目次 ◆1:NVIDIA製ドライバーの問題
はじめに ゲーム開発の旅を始める上で、開発者が最低限理解すべきコンピュータの基本的な仕組み、グラフィックスの原理、そしてスクリプティングの技術について、本記事では詳しく掘り下げていきます。 コンピュータの心臓部であるCPUとGPUの役割と相互作用から始め、これらがどのようにして3D空間のレンダリングやアプリケーションの実行に影響を与えるかを解説します。 Unityエンジンを用いたゲーム開発では、これらのハードウェアコンポーネントの理解が不可欠です。 続いて、ゲーム開発におけるグラフィックスの基礎を学びます。 ここでは、ビルトインレンダーパイプラインから、より高度なUniversal Render Pipeline (URP) やHigh Definition Render Pipeline (HDRP) まで、Unityで利用可能なレンダリングパイプラインの違いとその選択がプロジェクトに及
今月は任天堂について述べたい。 だがその前に,前回の記事を執筆したあとに発表されたSony Interactive Entertainmentの構造改革に触れておく。すでにBungieのレイオフが実施済みだったので,さらに人員削減が行われたことに驚いた人も多いだろう。2024年に入ってAAAやライブサービスに積極的に資本を投下していた米系メーカーがレイオフを積極化している。膨れ上がった開発費を回収することが,PS5の予想外の不振で難しくなっているからだ。 東洋証券では,Z世代が購買力を持つ結果,嗜好が変わり(行動変容),ゲーム販売がアニメ指向になるので,意味のない規制はやめ,ハードもゲーム機らしくしアニメの本場ともいえる日本市場の本格対応を進めるべきだと提案をしてきた。しかしSIEからは悲しい気持ちにしかならないから批判をしないでほしいという意見表明を返されてしまった。その結果が,8%,9
エムスリー株式会社(所在地:東京都港区、代表取締役:谷村 格、以下エムスリー)は、グループ会社の開発支援を行うエムスリーテクノロジーズ株式会社(代表取締役:山崎 聡(エムスリー取締役CTO / VPoP)、以下エムスリーテクノロジーズ)を2024年4月1日に設立します。 エムスリーは「インターネットを活用し、健康で楽しく長生きする人を1人でも増やし、不必要な医療コストを1円でも減らすこと」をミッションに掲げ、様々な事業を展開しています。国内では2009年頃より積極的にM&Aを実施しており、2023年3月時点で、132社のグループ会社を有しています。エムスリー本体以外の売上が連結売上に占める割合も、2023年3月時点で76%にのぼり、エムスリーグループの企業価値向上に寄与する大きなアセットとなっています。 これまでもエムスリーではエンジニアリンググループに所属するグループ会社支援チームを中心
機械学習エンジニアの吉田です。今回は機械学習モデルの推論サーバとして NVIDIA Triton Inference Server の性能を検証した話です。 背景 バクラクでは請求書OCRをはじめとした機械学習モデルを開発していますが、これらの機械学習モデルは基本的にリアルタイムで推論結果を返す必要があります。 請求書OCRを例にとると、お客様が請求書をアップロードした際にその内容を解析し、請求書の金額や日付などを抽出します。 このような推論用のAPIサーバはNginx, Gunicorn/Uvicorn, FastAPIで実装し、PyTorchモデルをGPUで推論する構成となっており、SageMaker Endpointを使ってサービングしています。 バクラクの推論APIはこのような構成でリリース以降特に問題なく稼働してきていますが、ご利用いただくお客様が増えるにつれてリクエストも増加し
神様。ちょい古なノートPCでゲーミング&生成AIの夢を見たいのですが2024.03.30 18:0023,795 武者良太 そのお願い。叶えてくれるのですか神様。 写真だけ見ると、ちょっと?いやかなり大きな多機能USBハブ。しかしこのハコのなかには、Radeon RX 7600M XTが入ってる。 AMD入ってる! つまるところこの「GPD G1 2024」はeGPUこと外付けGPUボックスです。モバイル用GPUを使うことで、レンガみたいなデカさの外付けGPUボックスからSwitchサイズにまでダイエットできたんですね。 Image: リンクスインターナショナル計測の仕方によっても変わるけど、Radeon RX 7600M XTはRTX 3060 Mobile~RTX 4060 Mobileくらいのパワーを持ってるGPU。そいつをこーしてこーやって小さめのハコに入れちゃった。使い勝手、よさ
PyTorch v1.12 以降では、macOS において Apple Silicon あるいは AMD の GPU を使ったアクセラレーションが可能になっているらしい。 バックエンドの名称は Metal Performance Shaders (MPS) という。 意外と簡単に使えるようなので、今回は手元の Mac で試してみた。 使った環境は次のとおり。 GPU が 19 コアの Apple M2 Pro を積んだ Mac mini を使用している。 $ sw_vers ProductName: macOS ProductVersion: 14.4.1 BuildVersion: 23E224 $ sysctl machdep.cpu.brand_string machdep.cpu.brand_string: Apple M2 Pro $ pip list | grep -i tor
DALL-E作成の「worker間で重複タスクを確認しながら作業を進める」イメージ図です こんにちは。AI・機械学習チーム(以下AIチーム)の池嶋(@mski_iksm)です。 仕事で、誰か一人がやればいい作業を、気がついたら同僚と同じタイミングでやっていた、という経験はありませんか? せっかく頑張って作った機能が実は被っていてムダになってしまった。。。というのは誰もが悲しいものです。 そうならないように作業チケットを切るなどしてタスクを中央管理する方法もありますが、もっとゆるくやりたいこともあるかと思います。 そういうときは一言「この作業私がやりますね!」と声掛けをすれば済みますね。 以前のブログで、私たちはgokartを使ったMLパイプラインの効率化について掘り下げました。 具体的には、「すでに完了したタスクをスキップする」と「タスクの実行順序をできるだけランダムにする」という2つの戦
[GDC 2024]Armが推奨するレイトレーシング時代のスマートフォンゲームグラフィックスとは? ライター:西川善司 Armの「Immortalis-G715」やQualcommの「Adreno 740」,古くはImaginationの「PowerVR Wizard」など,スマートフォン向けのSoC(System-on-a-Chip)に組み込まれたGPUが,レイトレーシング対応となって久しい。それにも関わらず,実際のスマートフォン向けゲームのグラフィックスに,レイトレーシングが採用された事例はまだまだ少ない。 そもそも,2024年の現状では,レイトレーシング対応GPU搭載のSoCを採用したスマートフォンがまだまだ少ない。だが,2023年発売の「iPhone 15 Pro」シリーズによって,状況は変わってくるかもしれない。iPhone 15 Proの搭載SoCである「A17 Pro」は,レ
2021年から2022年にかけてコロナ特需が起き、世界半導体市場は急成長した。ところが、2022年後半にコロナ特需が終焉(終えん)したため、2023年は史上最悪クラスの大不況に陥った。しかし、その大不況は2023年で底打ち、ことし(2024年)には本格回復すると期待されている。 そして、半導体市況が本格回復するかどうかはメモリの動向にかかっていると考えていた(拙著『2024年の半導体市場、本格回復はメモリ次第 ~HBMの需要増で勢力図も変わる?』)。 実際、種類別の半導体の四半期出荷額を見ると、Logicは既にコロナ特需のピークを超えて過去最高を更新している。また、Mos MicroとAnalogは、コロナ特需の終焉による落ち込みは大きくないため、2024年に過去最高を更新する可能性が高い(図1)。 その中で、Mos Memoryは大きく落ち込んだ後、2023年第1四半期(Q1)で底を打ち
NVIDIAは2024年3月21日(米国時間)、AI(人工知能)およびML(機械学習)開発者向けツールキット「NVIDIA AI Workbench」(以下、AI Workbench)の一般提供を開始した。公式サイトから無料でダウンロードできる。AI Workbenchの自動化機能により、開発初心者にとってのハードルを取り除き、専門家の生産性向上を支援するとしている。 開発者はAI Workbenchを使うことで、スキルレベルにかかわらず、高速で信頼性の高いGPU環境を構築し、異種プラットフォーム間で自由に作業、管理、コラボレーションができる。「NVIDIA AI Enterprise」のライセンスを購入すれば、エンタープライズサポートも受けられる。 AI Workbenchの特徴 関連記事 IBM、2024年に注目すべき9つのAIトレンドを解説 IBMは、2024年に注目すべき最も重要な
NVIDIAはAI開発に使われるGPUで大きなシェアを獲得しているほか、ソフトウェア開発および実行環境「CUDA」もAIの開発現場で広く採用されています。そんなNVIDIAの一人勝ち状態に対抗するべく、Intelや富士通、Google、Armなどのテクノロジー企業が参加する業界団体「Unified Acceleration Foundation(UXL Foundation)」がオープンなソフトウェア開発環境の構築を進めています。 UXL Foundation: Unified Acceleration https://uxlfoundation.org/ Unified Acceleration (UXL) Foundation https://www.intel.com/content/www/us/en/developer/articles/news/unified-accelera
Appleが今年後半の発売に向けて準備を進めている「iPhone 16」について。 そのハイエンド「iPhone 16 Pro」シリーズ向けとなる次世代「A18 Pro」チップは、AI機能を高めるためダイサイズが大きくなることをAppleのサプライチェーンに精通するHaitong International SecuritiesのアナリストJeff Pu氏が報告しています。 Pu氏はまたその最新報告で、A18 Proチップは6コアのGPUを搭載し、iPhone 15 ProシリーズのA17 Proチップと同等になるとも予測しています。 新しいiPhoneのイメージ 生成AI iOS 18には、Siri、Spotlight、Apple Music、ヘルスケア、メッセージ、Numbers、Pages、Keynote、ショートカットなど、iPhoneの諸機能やアプリに新しい生成AI機能が搭載され
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く