Hao Wang / 王昊

Hi, my name is Hao Wang and I am a Ph.D. candidate at Department of Computer Science and Communications Engineering, Waseda University. I am currently researching natural language processing at Kawahara Lab.

Research interests: Natural Language Processing, Multimodal Learning, Multilingual Alignment.
Email: conan1024hao[at->@]akane.waseda.jp

Education

Doctor of Engineering, Department of Computer Science and Communications Engineering, Waseda University. (Sep. 2024 - Sep. 2027, Sup: Daisuke Kawahara)
Master of Engineering, Department of Computer Science and Communications Engineering, Waseda University. (Apr. 2023 - Sep. 2024, Sup: Daisuke Kawahara)
Bachelor of Engineering, Department of Computer Science and Engineering, Waseda University. (Apr. 2019 - Mar. 2023, Sup: Daisuke Kawahara)

Experience

Research Intern / Visiting Researcher, New York University Courant Institute of Mathematical Sciences. (Oct. 2024 - Mar. 2025, NYC, Sup: Saining Xie)
Research Intern, OMRON SINIC X Corp. (Aug. 2023 - Jan. 2024, Tokyo, Sup: Yoshitaka Ushiku, Shohei Tanaka)
Trainee, RIKEN AIP. (Apr. 2023 - Mar. 2024, Tokyo, Sup: Shuhei Kurita)
Research Intern, CyberAgent AI Lab. (Mar. 2023 - Oct. 2023, Tokyo, Sup: Tetsuro Morimura, Ukyo Honda)
Research Assistant, Waseda University. (Nov. 2022 - Mar. 2023, Tokyo)

Software Engineer Intern, SB Intuitions Corp. (Aug. 2025 - Oct 2025, Tokyo)
Software Engineer Intern, Citadel AI, Inc. (Jun. 2024 - Sep. 2024, Tokyo)
Software Engineer Intern, LegalOn Technologies, Inc. (Feb. 2024 - Mar. 2024, Tokyo)
Software Engineer Intern, CyberAgent, Inc. (Feb. 2023 - Feb. 2023, Tokyo)
Software Engineer Intern, LINE Corp. (Aug. 2022 - Oct. 2022, Tokyo) [blog]
Software Engineer Intern, Fixstars Corp. (May. 2021 - Jul. 2021, Tokyo)
Software Engineer Intern, Morpho, Inc. (Oct. 2020 - Dec.2020, Tokyo)

Data Science Intern, MC Digital, Inc. (Jul. 2021 - Jan. 2022, Tokyo)
Data Science Hackathon First Place, P&G Japan. (Sep. 2021, Tokyo)

Publication

Preprint

Hao Wang, Eiki Murata, Lingfang Zhang, Ayako Sato, So Fukuda, Ziqi Yin, Wentao Hu, Keisuke Nakao, Yusuke Nakamura, Sebastian Zwirner, Yi-Chia Chen, Hiroyuki Otomo, Hiroki Ouchi, Daisuke Kawahara. 2025. VIR-Bench: Evaluating Geospatial and Temporal Understanding of MLLMs via Travel Video Itinerary Reconstruction. [paper] [github]
Hao Wang, Pinzhi Huang, Jihan Yang, Saining Xie, Daisuke Kawahara. 2025. Traveling Across Languages: Benchmarking Cross-Lingual Consistency in Multimodal LLMs. [paper] [github]

International Conference (Refereed)

Ziqi Yin, Hao Wang, Kaito Horio, Daisuke Kawahara, Satoshi Sekine. 2024. Should We Respect LLMs? A Cross-Lingual Study on the Influence of Prompt Politeness on LLM Performance. The Second Workshop on Social Influence in Conversations (SICon 2024) @ EMNLP 2024, Miami, United States. [paper] [github]
Shohei Tanaka, Hao Wang, Yoshitaka Ushiku. 2024. SciPostLayout: A Dataset for Layout Analysis and Layout Generation of Scientific Posters. The 35th British Machine Vision Conference (BMVC 2024), Glasgow, United Kingdom. [paper] [dataset] [github]
- Also presented at the workshop on Graphic Design Understanding and Generation (GDUG) @ CVPR 2024, Seattle, United States. [paper] [poster] [slide]
Hao Wang, Shuhei Kurita, Shuichiro Shimizu, Daisuke Kawahara. 2024. SlideAVSR: A Dataset of Paper Explanation Videos for Audio-Visual Speech Recognition. The Third Workshop on Advances in Language and Vision Research (ALVR) @ ACL 2024, Bangkok, Thailand. [paper] [github] [poster]

Hao Wang, Tetsuro Morimura, Ukyo Honda, Daisuke Kawahara. 2024. Reinforcement Learning for Edit-Based Non-Autoregressive Neural Machine Translation. The 2024 Conference of the North American Chapter of the Association for Computational Linguistics: Student Research Workshop (NAACL SRW 2024), Mexico City, Mexico. [paper] [poster]
Takuya Uematsu, Hao Wang, Daisuke Kawahara, Tomohide Shibata. 2024. A Benchmark Suite of Japanese Natural Questions. The 13th Joint Conference on Lexical and Computational Semantics (*SEM 2024) @ NAACL 2024, Mexico City, Mexico. [paper]

Hao Wang, Hirofumi Shimizu, and Daisuke Kawahara. 2023. Kanbun-LM: Reading and Translating Classical Chinese in Japanese Methods by Language Models. Findings of the Association for Computational Linguistics: ACL 2023 (Findings of ACL 2023), Toronto, Canada. [paper] [github] [demo] [poster]

Domestic Journal (Refereed)

植松拓也, 王昊, 福田創, 河原大輔, 柴田知秀. 日本語Natural QuestionsとBoolQの構築. 自然言語処理, 2025, 32巻, 2号, p. 497-519. [paper]
王昊, 清水博文, 河原大輔. 言語モデルを用いた漢詩文の返り点付与と書き下し文生成. 自然言語処理, 2024, 31巻, 1号, p. 135-154. [paper]

Domestic Conference (Non-Refereed)

田中翔平, 王昊, 牛久祥孝. SciPostLayout: 科学論文ポスターのレイアウト解析およびレイアウト生成のためのデータセット. 第27回画像の認識・理解シンポジウム(MIRU2024).
王昊, 藤田正悟, 神田峻介. 契約書条文に特化した文埋め込みモデルの構築. 第260回自然言語処理研究発表会(NL260). [paper] [slide]
王昊, 栗田修平, 清水周一郎, 河原大輔. SlideAVSR: 視聴覚音声認識のための論文解説動画データセット. 言語処理学会第30回年次大会(NLP2024). [paper]
尹子旗, 王昊, 堀尾海斗, 河原大輔, 関根聡. プロンプトの丁寧さと大規模言語モデルの性能の関係検証. 言語処理学会第30回年次大会(NLP2024). スポンサー賞 (メルカリ賞) 受賞. [paper]
植松拓也, 王昊, 河原大輔, 柴田知秀. 日本語Natural QuestionsとBoolQの構築. 言語処理学会第30回年次大会(NLP2024). 若手奨励賞 (筆頭著者のみ対象) 受賞. [paper]
Arseny Tolmachev, Masayoshi Hayashi, Takuro Niitsuma, Rintaro Enomoto, Hao Wang, Shuhei Kurita, Daisuke Kawahara, Kazuma Takaoka, Yoshitaka Uchida. Uzushio: A Distributed Huge Corpus Processor for the LLM Era. 言語処理学会第30回年次大会(NLP2024). [paper]

堀尾海斗, 村田栄樹, 王昊, 井手竜也, 河原大輔, 山崎天, 新里顕大, 中町礼文, 李聖哲, 佐藤敏紀. 日本語におけるChain-of-Thoughtプロンプトの検証. 2023年度人工知能学会全国大会(第36回, JSAI2023). [paper] [github] [slide]

王昊, 清水博文, 河原大輔. 言語モデルを用いた漢文の返り点付与と書き下し文生成. 言語処理学会第29回年次大会(NLP2023). [paper] [poster]
王昊, 中町礼文, 佐藤敏紀. 日本語の大規模な基盤モデルに対するLoRAチューニング. 言語処理学会第29回年次大会(NLP2023). [paper] [slide]

Hao Wang / 王 昊

Hao Wang / 王昊