2024年3月5日に開催された日本データベース学会年次総会にて,2023年度日本データベース学会若手功績賞を受賞しました.本賞は,データベース分野およびその関連分野における優れた研究実績に加えて,学会活動への多大な貢献が認められた若手研究者に贈られるものです.
賞の名称
日本データベース学会若手功績賞
授与団体・学会
一般社団法人 日本データベース学会
受賞者名
山本 祐輔(名古屋市立大学)
受賞日
2024年3月5日
気づきの情報インタラクションデザインの研究をしている人
2024年3月5日に開催された日本データベース学会年次総会にて,2023年度日本データベース学会若手功績賞を受賞しました.本賞は,データベース分野およびその関連分野における優れた研究実績に加えて,学会活動への多大な貢献が認められた若手研究者に贈られるものです.
日本データベース学会若手功績賞
一般社団法人 日本データベース学会
山本 祐輔(名古屋市立大学)
2024年3月5日
ビッグデータ分析の世界がとても華やかなものに思われている方がいらっしゃるかもしれません.しかし,実際のビッグデータ分析は極めて泥臭いものです.機械学習や数理モデリングといった「花形」分析技術を使うのは,データ分析プロセスの中でもほんの一部.データ分析の大半は,収集したデータの「前処理」に費やされます.
では,なぜデータの前処理に時間がかかるのでしょうか?よくある原因の1つは,分析のために用意したデータが「バッドデータだったから」です.バッドデータとは,コンピュータで分析するときに邪魔になるデータの俗称です.例えば,
といったものが挙げられます.このようなデータが混ざっていると,データ分析中にエラーやおかしな結果が出たりして,有意義なデータ分析が行えなくなります.とはいえ,バッドデータも質を改善できれば,ビッグデータとして活かせる可能性はあります.ですので,分析者は投げ出したい気持ちを押さえながら,時間を割いてバッドデータをキレイにするのです.
ところで,人間には使いやすくても,コンピュータには扱いづらいデータも存在します.その例が,図2のようなExcelを方眼紙のように使って作られたデータです.この種のデータを大量に分析する場合,分析者の苦労がまた一つ増えることになります.なぜなら,どのマス目が何を意味しているのか,人間が逐一定義しなければ,コンピュータはデータの意味を理解できないからです.コンピュータは人間のように空気を読んでデータを見てはくれないのです.
ビッグデータ分析は「21世紀で最も素敵な仕事」と言われることもありますが,実はかなり地味な側面も持ちあわせているのです.
2024年1月31日に開催された名古屋市広域連携に関する研究会で招待講演を行いました.タイトルは「ビッグデータ x AI = DX?」です.
独自ドメインでGmailからメールを送信する場合,DKIM設定が必要
新しい職場のメールを,自分のGoogle WorkspaceのGmailで読み書きできるようにした.うまく設定できているように見えたが,Gmailを使っている人にメールを送信すると,エラーが返ってくることに気付いた.エラーメッセージを見ると,使用しているドメインにSPFもしくはDKIMを設定しろと書かれている.
今までこんなケースはなかったので戸惑った.調べてみると,Googleがガイドを公開していた.この記事によると,
2022 年 11 月より、個人用 Gmail アカウントにメールを送信する新規の送信者は、SPF または DKIM を設定する必要
だそうだ.なりすましと迷惑メールを防ぐ仕組みらしい.まったく知らなかった.
原因が分かれば対策は簡単.迷惑メールと間違えられないようにするSPFやDKIMは新しい仕組みでもなく,Google Workspaceを使っている人の中にも大分前から対策をしてる人もいるよう.記事を参考に設定を済ます.やることは
するだけ.
設定後,テストメールを送ってみると,電子署名が付与されていることが確認された.多分これで問題解決.
2023年4月1日をもって,静岡大学情報学部から名古屋市立大学データサイエンス学部に異動しました.今後ともどうぞよろしくお願いします.
第15回データ工学と情報マネジメントに関するフォーラムDEIM2023にて発表した下記の研究成果について,プレゼンテーション賞,最優秀インタラクティブ賞,および優秀インタラクティブ賞を受賞しました.
ヒューマン・コンピュータ・インタラクションに関する大きな国際会議である HCI International 2023にて,以下の研究成果が採択され発表することが決定しました.
情報検索の分野で知られているポジションバイアスを緩和する手法に関する以下の研究成果が,情報処理学会論文誌に採択されました.
庵谷 拓輝, 山本 祐輔: “損失回避バイアスを用いたスニペット表示によるレビュー検索結果のポジションバイアス緩和“, 情報処理学会論文誌データベース(TOD), 15(3), 7-19 (2022-10-13), 1882-7799
研究室で行った研究の成果として,下記の論文が The 2022 ACM International Conference on Information Technology for Social Good (GoodIT 2022) に採択されました.
後日,詳細な書誌情報を掲載する予定です.
項目反応理論(IRT: Item Response Theory)は,TOEFLなどのような試験の各設問の難易度,および回答者の能力を推測するためのモデルである.基本的な考え方は,回答者の能力と設問の難易度をパラメータとするロジスティック関数をある設問の正解確率と見なし,試験の回答状況は定義された正解確率をパラメータとするベルヌーイ分布に従う,というものである.
パラメータの推定方法は最尤推定法が一般的であるが,バージョン4にアップデートされたPyMCの練習をかねて,MCMCで項目反応理論のパラメータ推定をやってみた.
以下は,Gistに置いたPyMCによるコード例であるである.どうぞご笑覧ください(Github Gistコードへの直リンク).