研究

構造化文書に対する情報検索

  • 効果的な検索
    • スコアリング法の提案
    • 重要部分の抽出
    • スコアリング結果の統合
  • 動的な索引再構築手法の提案
    • 効率的な検索とデータ更新を考慮したデータ構造の定義
    • 更新コスト削減のためのフィルタの提案
  • XML 検索エンジン構築


語義曖昧性解消

  • 知識ベースを利用した語義曖昧性解消
    • 整数線形計画問題による語義曖昧性解消
    • 知識ベースの拡張
  • 語義を利用した情報検索

Web クエリに対する品詞推定

  • 大規模的スチコーパスを利用した品詞推定
  • 公開データセット: 品詞付きクエリ
    • 下記のデータセットを利用する際には,Atsushi Keyaki and Jun Miyazaki: “Part-of-speech Tagging for Web Search Queries Using a Large-scale Web Corpus”,proceedings of the 32nd ACM Symposium on Applied Computing (SAC2017), Morocco, April, 2017. を引用してください.
    • Web track topics of TREC Web Track
    • MS-251 without conflict

検索タイプごとの情報要求の複雑性評価

  • 公開データセット: Information unit (iUnit) の粒度・構造アノテーション
    • 下記のデータセットを利用する際には,Atsushi Keyaki and Jun Miyazaki:"Analysis of Relevant Text Fragments on Different Search Task Types",proceedings of the 14th Asia Information Retrieval Societies Conference (AIRS 2018), Taipei, November, 2018. を引用してください.
    • MobileClick-2 iUnit