pythonを利用した特許情報分析

出願動向分析プログラム

/

 商用データベースからダウンロードした特許公報データから特許出願動向の調査レポートをワンクリックで自動作成するプログラムです。

 本ホームページからダウンロードしたフォルダ「出願動向調査data」内に特許公報データをコピー&ペーストし、テーマ名と調査目的を設定し、pythonを実行するだけで、100ページ(100程度の図表を含む)程度の調査レポートを自動作成できます。

※ 当方での作成時間は15分程度でしたが、notebookではこの4倍程度かかると思います。

 作成したプログラムはテーマ毎に異なり、次のプログラムを作成した(まだ、バグがありそうですが、とりあえず公開しておきます)。

単一テーマ(例: 人工知能技術の特許出願動向)

複合テーマ(例: テレワーク、遠隔授業などの特許出願動向)

特定出願人(例: DIC株式会社の特許出願動向)

グループ単位(例: 主要大学の特許出願動向)

/

 上記のプログラム、公報データ、補助データなどは一つのフォルダにまとめ、動作するようにしているので、このフォルダ「出願動向調査data」を圧縮して公開します。

/

 以下、このフォルダ「出願動向調査data」が解凍されているものとして説明します。

 まず、フォルダ「出願動向調査data」にpython本体(またはコピー)を置きます。

 次に、テーマ毎に、次の手順でデータを用意し、プログラムを起動し、プログラム終了後に「report.docx」の内容を確認するという流れになります。

 具体的には、次のようになります。 

/

単一テーマの場合は、さらに、次のデータを用意します。

・・ダウンロードした特許公報データをCSV形式として保存した「分析公報data.csv」をコピー&ペーストする。

・・「テーマ設定データ」を開き、シート「テーマ名」のA2セルにテーマ名を書き込み、シート「調査目的」をA2セル以下に書き込む。

・・pythonを起動し、「特許出願動向調査_singleV05.ipynb」を選択し、実行する。

・・プログラム終了後に「report.docx」の内容を確認する。

/

複合テーマの場合は、さらに、次のデータを用意します。

・・ダウンロードした特許公報データをEXCELL形式として保存した「subテーマ一括分析公報.xlsx」をコピー&ペーストする。

・・「テーマ設定データ」を開き、シート「テーマ名」のA2セルにテーマ名を書き込み、シート「調査目的」をA2セル以下に書き込み、シート「subテーマ」にコードとサブテーマを書き込む。

・・pythonを起動し、「特許出願動向調査_multiV05.ipynb」を選択し、実行する。

・・プログラム終了後に「report.docx」の内容を確認する。

  ※ エラー(最終ステップの[*]が[ ]に変化)となった場合、まず、フォルダ「テーマ設定data.xlsx」のシート「subテーマ」が正しいか確認してみてください。私はこれで失敗しましたので 。

/

特定出願人の場合は、さらに、次のデータを用意します。

・・ダウンロードした特許公報データををCSV形式として保存した「分析公報data.csv」をコピー&ペーストする。

・・「テーマ設定データ」を開き、シート「テーマ名」のA2セルにテーマ名を書き込み、シート「調査目的」をA2セル以下に書き込む。

・・pythonを起動し、「特定出願人動向調査V07.ipynb」を選択し、実行する。

・・プログラム終了後に「report.docx」の内容を確認する。

/

グループ単位の場合は、さらに、次のデータを用意します。

・・ダウンロードした特許公報データをEXCELL形式として保存した「subテーマ一括分析公報.xlsx」をコピー&ペーストする。

・・「テーマ設定データ」を開き、シート「テーマ名」のA2セルにテーマ名を書き込み、シート「調査目的」をA2セル以下に書き込み、シート「subテーマ」にコードとグループ名称を書き込む。

・・pythonを起動し、「特許出願動向調査_groupV05.ipynb」を選択し、実行する。

・・プログラム終了後に「report.docx」の内容を確認する。

  ※ エラー(最終ステップの[*]が[ ]に変化)の場合は、フォルダ「テーマ設定data.xlsx」のシート「subテーマ」が正しいか確認してみてください。

/

 分析公報dataの形式は2通りあり、単一テーマと特定出願人の場合はCSV形式で、項目は次のとおり。

「公報番号、出願番号、発行日(公報)、発明等の名称、出願人・権利者、発明者、IPC、FI、Fターム、要約」

 複合テーマとグループの場合はEXCELL形式で、項目は次のとおり。

※ コードの後に要約を追加しました。

「公報番号、出願番号、発行日(公報)、発明等の名称、出願人・権利者、発明者、IPC、FI、Fターム、コード、要約

/

 上記4種のプログラムにより作成したレポートのサンプル(PDF)はフォルダ単位で圧縮して公開する(ただし、公報発行日が2022年10月9日以前の10年間程度のデータで作成したものです)。