[English page]


NTCIR-7特許マイニングタスク
参加募集


更新情報

タスク概要

背景

特許出願が重要な研究活動のひとつとして考えられるようになってきた今日, 大学研究者自身が関連論文だけでなく関連特許について情報を検索したり,特許 を出願したりする機会が増えています.2006年6月に政府の知的財産戦略本部が 発表した「知的財 産権推進計画2006」(首相官邸ウェブページ)においても,大学研究における特許情報の重要性が謳わ れています.この計画で,大学研究者の利用を想定した特許・論文情報統合検索 システムの整備が含まれていることからも,このような傾向が今後さらに強まっ ていくことがうかがわれます.

特許と論文を検索するのは,大学研究者に限った話ではありません. 例えば,特許庁の審査官は,出願された技術が特許権の取得に該当するかどうか 判断するために,過去に同様の特許が出願されたり論文が発表されたりしていな いか調査します.これは,一般に無効資料調査と呼ばれています.同様の調査は, 民間企業ではサーチャーと呼ばれる専門の担当者が審査官による審査を経た出願 技術を再調査し,競合する他者の権利を無効化するために社内で行われることも あります.そこで,本タスクでは,特許と論文を対象にした検索や技術動向分析 など,様々な目的に利用可能な言語処理技術の開発を目指します.

NTCIR-7におけるタスク

  ※なお,タスクの詳細はWebページに掲載します(原則としてタスク参加者のみアクセス可能).

このタスクには,これまでのNTCIR 特許分類タスク用システムを改良(分類体 系をFタームからIPCに変更)することで参加できます.また,これまでの特許検 索タスク参加チームも,例えば以下のような手順により,検索タスク用に開発さ れたシステムを変えることなく,本タスクへの参加が可能です.

  1. 入力された抄録からクエリを抽出し,関連特許を検索する.(NTCIR-6の検索システムを利用)
  2. 手順1で検索された特許に付与されているIPCコードを抽出する.
  3. 検索結果上位1000件で抽出されたIPCコードを頻度順に並べ替え,出力する.

タスクのねらい

一般に,特許では請求範囲をなるべく広く確保するため,論文よりも一般性の高 い特許用語を用いて記述する傾向があります.本タスクでは,このような論文と 特許の用語の使われ方の違いを吸収できる分類や検索のための基礎技術の確立を 目指します.

ロードマップ

「論文の国際特許分類への自動分類タスク」で開発されたシステムは,将来的に は以下のような研究課題に利用することを視野に入れています.

特許と論文を対象にした技術動向分析

同一IPCが付与された特許と論文を,例えば「要素技術」と「効果」という2 つの観点で再分類し,例えば図1のような特許と論文を対象にした技術動向マッ プを作成します.図1において,赤字は論文,青字は特許を示しています.

図1 あるIPCコードに分類された論文と特許から生成した技術動向マップの例
効果1効果2効果3
技術1 [山田 1993]
[特開平05-XXXX]
[鈴木 2002]
技術2 [田中 2000]
技術3 [特開平06-YYYY] [特開平04-ZZZZ]
[特開平06-WWWW]

特許と論文間の引用関係を利用したマイニング

特許と論文を対象にした技術動向分析は,大学,企業,研究所等で,研究や 開発の方向性を決めるために,戦略調査目的で行うだけでなく,投資や研究資金 の分配といった政策決定の際の根拠としても利用することができることから,こ の分野への関心も高まっています.実際に科学研究活動について分析・評価を行 う科学計量学(サイエントメトリクス)の分野では,特許と論文を対象にした様々 な分析結果が報告されています.それによれば,一般に,基礎研究と産業の結び つきが強い分野では,特許が数多くの論文を引用していると考えられており,そ こで特許中の引用論文数を数えることで,分野ごとの基礎研究と産業の関連度を 定量的に測ることが可能になります.なお,この分野の研究動向は,以下のサー ベイ論文等をご参照下さい.

Mayer, M. Does Science Push Technology? Patents Citing Scientific Literature. Research Policy. Vol. 29, 409-434 (2000)

一方で,特許中では必ずしも関連論文を十分に引用しているとは限らないと いう指摘もあります.そこで,以下の手順により,引用ベースで技術動向マイニン グを行う方法が考えられます.

  1. 論文の特許分類体系への自動分類:
    論文抄録に、特許分類体系のひとつである「国際特許分類IPC(International Patent Classification)」に自動分類します.(NTCIR-7)
  2. 特許中で引用すべき関連論文の検出:
    ある特許と同一のIPCコードが付与された 論文の中から,その特許中で引用すべき関連論文を検出します.
  3. 特許,論文間の引用関係を用いた技術動向マイニング:
    特許, 論文間の引用関係を用い,技術動向マイニングを行います.ここで技術動向マイ ニングとして,例えば「ある分野の技術の変遷を捉える」「ある分野における重 要技術を検出する」「ある特許の権利を無効化する論文を検出する」といったタ スクが考えられます.

予備実験の報告書

本タスクを設計するにあたり,オーガナイザが実施した予備実験の報告書です. [PDFファイル]

※報告書の内容は、本タスクの最終的な実験条件および評価と変わる可能性があります.また,予備実験に用いるシステムはあくまでも一例であり,タスク参加者はこれに縛られる必要はありません.

提供するデータ

参加申込み方法

こちらからお申込み下さい

スケジュール

準備 タスク参加申込み受付 -2007.11.15
文書データ配布 申込み後,随時
ドライラン 課題配布 2008.01.10
結果提出締切 2008.02.10
評価結果配布 2008.03.05
結果の分析(検討会) 2008.03
フォーマルラン 課題配布 2008.05.01 2008.05.14
結果提出締切 2008.05.31 2008.06.13
評価結果配布 2008.06.10 2008.06.23
結果の分析(検討会) 2008.07
成果報告会への準備 成果報告書締切 2008.10.01
成果報告書(カメラレディ) 2008.11.01
成果報告会(於: 東京) 2008.12.16-19

  ※スケジュールの変更は,本ページとタスク参加者用メーリングリストでお知らせします.

オーガナイザ

お問い合わせ

 


Last modified on May 3, 2008