さきがけ研究者

田中(石井) 久美子
東京大学
先端科学技術研究センター
教授
研究室ホームページ
研究概要
ビッグデータの大半は言語に関わるものであり、これを処理対象とする高性能な情報検索や自動翻訳等は社会的課題です。処理性能を向上させるには、言語の数理的本質を明らかにする必要があります。本研究では、言語の複雑さに関する統計量のうち、文書量に対して収束するものを探求することにより、言語の本質に迫ります。統計量を理論的に整理したり、文書ごとの収束値を互いに比較し、人間の様々な知の複雑さを比較・考察します。