2022年をザッと振り返る
年末恒例の振り返り記事です。 昨年 4 月の部署異動を契機に、今年も研究開発部署にて案件を自分自身で創出・推進していくことに挑戦した一年でした。 本記事では、対外公表している事例の一覧をまとめました。 今年執筆していた共著の作業も終わり、出版が目前に迫っています。 来年も事業貢献と研究活動の両面を追い求めていければと思っています。
査読付き国際学会・ワークショップ
- Shotaro Ishihara, and Yasufumi Nakama (2022). Analysis and Estimation of News Article Reading Time with Multimodal Machine Learning. In Proceedings of 2022 IEEE International Conference on Big Data (Industrial & Government Track). (to appear) [slide]
- Shotaro Ishihara*, Hiromu Takahashi*, and Hono Shirai (2022). Semantic Shift Stability: Efficient Way to Detect Performance Degradation of Word Embeddings and Pre-trained Language Models. In Proceedings of the 2nd Conference of the Asia-Pacific Chapter of the Association for Computational Linguistics and the 12th International Joint Conference on Natural Language Processing, pages 205–216, Online only. Association for Computational Linguistics. (*equal contribution) [paper] [poster, slide] [code]
- Shotaro Ishihara, and Hono Shirai (2022). Nikkei at SemEval-2022 Task 8: Exploring BERT-based Bi-Encoder Approach for Pairwise Multilingual News Article Similarity. In Proceedings of the 16th International Workshop on Semantic Evaluation (SemEval-2022), pages 1208–1214, Seattle, United States. Association for Computational Linguistics. [paper] [slide] [poster]
- Shotaro Ishihara, and Yasufumi Nakama (2022). Generating a Pairwise Dataset for Click-through Rate Prediction of News Articles Considering Positions and Contents. In Proceedings of Computation + Journalism Conference 2022. New York, NY, USA, 5 pages. [paper] [slide]
国内学会・研究会発表
- 石原祥太郎 (2022). 国際会議参加報告 AACL-IJCNLP 2022. 第24回音声言語シンポジウム・第9回自然言語処理シンポジウム. [slide]
- 梶川怜恩, 鈴木刀磨, 二宮大空, 石原祥太郎 (2022). LightGBMのランク学習による商品レビュー評価. NLP若手の会 (YANS) 第17回シンポジウムハッカソン最終成果報告. [code](Applied Scientist賞 [website])
- 馬嶋海斗, 石原祥太郎 (2022). ニュース用語を含むヒント付きクロスワードパズルの自動生成. NLP若手の会 (YANS) 第17回シンポジウム.(奨励賞 [website])
- 石原祥太郎, 中間康文 (2022). 新聞記事のクリック率予測に向けたペアワイズ学習用データセットの構築手法の検討. 2022年度人工知能学会全国大会(第36回)論文集. [paper] [slide]
- 高橋寛武, 石原祥太郎, 白井穂乃 (2022). 単語分散表現を用いた新型コロナウイルスによる意味変化検出. 言語処理学会第28回年次大会発表論文集. [paper]
- 大村和正, 白井穂乃, 石原祥太郎, 澤紀彦 (2022). 決算短信からの業績要因文の抽出に向けた業績発表記事からの訓練データの生成. 言語処理学会第28回年次大会発表論文集. [paper]
- 増田太郎, 石原祥太郎, 吉田勇太 (2022). 企業の業界分類予測における共変量シフト問題の抑制. 第14回データ工学と情報マネジメントに関するフォーラム. [paper] [slide]
- 山田健太, 山本真吾, 石原祥太郎, 澤紀彦 (2022). F√V:オンラインニュースメディアにおける解約予測指標の開発と活用. 第14回データ工学と情報マネジメントに関するフォーラム. [paper]
イベント登壇
- Kaggle メダリストが話す、データと分析手法の見つけ方, 東京大学グローバル・インターンシップ・プログラム(UGIP), Dec 16th, 2022.
- 実践:日本語文章生成 Transformersライブラリで学ぶ実装の守破離, PyCon JP 2022, Oct 14th-15th, 2022.
- SageMakerを用いた日経電子版向け大規模言語モデルの構築, AWS AI/ML Updateと事例紹介, July 21st, 2022.
- 機械学習コンテストの潮流と上位解法, 第85回人工知能セミナー, July 11th, 2022.
- 企業で働くKagglerのキャリアトーク, Social Tech Talk #03, June 15th, 2022.
- 機械学習コンペの近年の潮流 2022年4月版, ML Study #3「機械学習コンペ」, Apr 4th, 2022.
- Editors-in-the-loop なニュース記事要約システムの提案, Machine Learning Casual Talks #13 (Online), Mar 30th, 2022.
- Sports Analyst Meetup の紹介, スポーツアナリティクスジャパン2022, Mar 26th, 2022.
- 日本経済新聞社における自然言語処理の取り組み, NLP若手の会懇親会 (YANS懇) 2022, Mar 11st, 2022.
インタビュー・メディア掲載
- 【開催報告 & 資料公開】AWS AI/ML Updateと事例紹介 〜AI/ML で解決したいビジネスの課題、AI/ML サービス活用のコツについてご紹介〜, Amazon Web Services ブログ, Sep 20th, 2022.
- エンジニアのキャリアと生存戦略を考える。日立製作所主催「Social Tech Talk #03」イベントレポート, Qiita Zine, Sep 2nd, 2022.
- 機械学習コンペ QAセッション「Kaggleで優勝する方法は?」, Forkwell Press, Aug 15th, 2022.
- The Kaggle Book: Data analysis and machine learning for competitive data science, Apr 22nd, 2022.
機械学習コンペ
- Fake News detection 6th (Solo), 2022.
- NLP若手の会 (YANS) 第17回シンポジウム ハッカソン, 1st (Team), 2022.
- Kaggle Days Championship Final 参加