pythonを利用した特許情報分析

特許出願動向調査のプログラム

/

 ワンクリックで、公報データを処理し、特許出願動向を分析し、レポートを作成するpythonプログラムおよび補助データをダウンロードできます。

/

・単一テーマ用のプログラム

・複数のサブテーマ用のプログラム

 上の2つはプログラムのテキストデータにリンクしましたが、この方法ではテキストの入力に時間がかかりすぎた(力尽きた!)ので、4つのテキストデータを全て1つのフォルダにまとめ、フォルダを圧縮してダウンロードする方法に変更しました。

 上の2つは内容確認用のサンプルとして残しておきますが、全プログラムの内容を確認したい場合には、下の「出願動向プログラムテキスト」をダウンロードしてください。

 ダウンロードしたフォルダを解凍すると、次の4つのテキストデータが読み取り可能になります。

 ただし、これもプログラムの内容を確認するためのものであり、pythonが利用可能であれば、下の「出願動向調査補助data+」をダウンロードし、python上で確認してください。

・・特許出願動向調査_singleV05

・・・単一テーマの公報データを処理して特許出願動向調査のレポートをワンクリックで作成する。

・・特許出願動向調査_multiV05

・・・複数のサブテーマの公報データを結合してテーマ全体の公報データを作成し、このテーマ全体の公報データに対して処理を行い、特許出願動向調査のレポートをワンクリックで作成する。

・・特許出願動向調査_groupV05

・・・同じグループに属する複数の出願人の公報データを結合してテーマ全体の公報データを作成し、このテーマ全体の公報データに対して処理を行い、特許出願動向調査のレポートをワンクリックで作成する。

・・特定出願人動向調査_V065

・・・特定出願人の公報データに対して処理を行い、特許出願動向調査のレポートをワンクリックで作成する。

/


・出願動向調査補助データ

 レポートの自動作成のために多くの補助データを必要とし、また、全体を一つのフォルダに置く必要があるので、プログラムや補助データを含むフォルダ全体を圧縮し、ダウンロードできるようした。

 ダウンロードしたフォルダはデスクトップ上に置き、フォルダ中のフォルダ「pat_python」にpython本体を格納して使用します。

 分析する公報データ(分析公報data.csv、subテーマ一括分析公報)とテーマ設定data.xlsxを設定すれば、ワンクリックでレポート(report.docx)が作成できます。

 ※ python本体は、macでもWindowsでもネットから無料で取得でき、関連データもネットから簡単に入手できます。

 フォルダ名は当方の都合で付けたもので、変更可能です。

 pythonが利用可能であれば、次の「出願動向調査補助data+」をダウンロードしてください。

 ダウンロードしたフォルダを解凍すると、パラメータなどの補助データ、公報データ、テーマ設定用データなど、上記プログラムを動作させるための全データを含んだフォルダが利用可能になります(ただし、python本体は各自で用意し、「pat_python」にセットしてください)。

/

・出願動向調査のテストデータ

 どのプログラムを使用するか、公報データの項目や形式はどうなっているか、テーマ設定は具体的にはどうするかなどを、文章で説明することが難しいのでサンプルを用意しました。

 ただし、「report.docx」はプログラムを実行した結果のサンプルで、どういうレポートが作成されるのかを予め確認するためだけのデータです。

 ダウンロードしたフォルダを解凍すると、次の4つのテストデータを含んだフォルダ「テストデータ」が取得できます。

・単一テーマ(テーマは「人工知能」)

・複合テーマ(テーマは「テレワークなど」)

・グループ(テーマは「主要大学分析」)

・特定出願人(テーマは「DIC株式会社」)

 pythonが利用できるようになり、上記テーマをテストする場合は、テストしたいテーマの「分析公報data.csv」または「subテーマ一括分析公報.xlsx」と、「テーマ設定data.xlsx」を、上でダウンロードしたフォルダにコピー&ペーストし、pythonを起動し、一括処理します。

 処理結果のレポートは、同じフォルダ内に「report.docx」として書き出されます。

/

※ 参考

当方のパソコン環境は以下のとおり。

iMac 21.5inch, Late2013
プロセッサ 3.1GHz クアッドコアintel core i7
1600 MHz DDR3
メモリ16GB

macOS Catalina

使用Python のバージョン: Python 3.8.3(フォルダ「pat_python」内にインストール)

/

 当方のパソコン環境での処理時間は10分〜15分でしたが、notebookタイプの場合にはこの4倍程度かかると思います。