/
発明とは課題を解決する方法を文章で表現したものということができる。
そこで、課題と解決方法との関連を分析すれば、新たな発明を考え出すツールになるのでは考え、トライしてみた。
まだ、このアプローチは始めたばかりで、これは使えると思われるものは出来ていないが、どなたかがこの考えを発展して役に立つものを作っていただけないかと考え、現段階で公開しておくこととした。
このアプローチでは、公報データの要約や課題などから課題を抽出し、コード化するのに多大の時間を要したので、ここから説明する。
課題を抽出するために参考とした公報は、株価と公報発行件数との相関度が高かった88社から発行された約60万件の公報を対象としている。
もちろん、この全ての公報を目視で読み、課題を抽出した訳ではなく、ある程度の件数を読み、課題を抽出したら、その課題を含む公報を除外し、残りの公報から再び目視で課題を抽出し、その課題を含む公報を除外するという作業を繰り返して抽出したもので、当然、不完全なものです。
しかし、このような手抜きの作業でも多大な時間がかかることを考慮し、分析用の基礎データとしてはこの程度で良しとしてガマンすることとした。
このようして抽出した課題を8階層に分類・配置した表は2025年3月現在で105,161行となっている(課題code表)。
また、この表の個々の課題を公報データから抽出するためにキーワードを公報データから1語〜3語抽出し、対応する課題と課題コードを付加した表を作成した(課題KW表)。
この課題KW表は、同じ課題でも異なるキーワードが有るので、2025年3月現在で113,826行となっている。
上記課題code表と課題KW表はEXCELL形式のファイル「課題code化data.xlsx」に含めている。
この「課題code化data.xlsx」だけを確認できるように、圧縮して公開する。
前置きはこれ位として、課題と解決方法の分析について説明する。
課題と解決方法の分析を行う場合には、本ホームページからダウンロードしたフォルダ「課題と解決方法の分析data」内にpython本体(またはコピー)を置きます。
また、フォルダ「課題・対策data」をデスクトップ上に置きます。
フォルダ「課題・対策data」は88社・60万件の公報データの要約や課題から課題、課題コード、主要構成要件などを各社毎に抽出し、各社毎にEXCELL形式の表にしたものを1フォルダにまとめたものであり、作成方法については後で説明する。
作成したプログラムは次の2種類である。
・課題コード別の課題・主要構成ファイル一括作成.ipynb
・・課題コードと、改良したい技術内容とを入力し、フォルダ「課題・対策data」内の全公報から入力した課題コードを含む公報に絞り込み、絞り込んだ公報と先に入力した「改良したい技術内容」との類似度を算出し、この類似度の高い公報を参考公報として出力する。
・KW別の課題・主要構成ファイル一括作成.ipynb
・・キーワードと、改良したい技術内容とを入力し、フォルダ「課題・対策data」内の全公報から入力したキーワードを含む公報に絞り込み、絞り込んだ公報と先に入力した「改良したい技術内容」との類似度を算出し、この類似度の高い公報を改良技術の参考公報として出力する。絞り込み後の件数が多い場合はキーワードを追加可能にしている。
/
これらのプログラムは使い始めたばかりで、有効性、改善点は不明であるが、「KW別の課題・主要構成ファイル一括作成.ipynb」の方が有効性が高いようである。
/
ここで、上記の「課題・対策data」内の公報データの作成方法についても触れておく。
この公報データを作成するためには、「要約」、「課題」、「請求の範囲」などを追加する必要がある。
したがって、商用データベースから公報データをダウンロードする場合、次の項目をダウンロードする。
「公報番号、出願番号、公報発行日、発明等の名称、出願人、発明者、IPC、FI、Fターム、要約、発明の目的、利用分野、従来の技術、発明の効果、課題、請求範囲」
「請求範囲」は請求項1だけで良いのだが、全請求項でも差し支えない(後にプログラムで請求項1だけ切り出して利用するため)。
課題と課題コードは、まず、公報データの「発明等の名称、要約、発明の目的、従来の技術、発明の効果、課題」から課題が含まれている単文を切り出し、次に、この単文中に「課題code化data.xlsx」の「課題KW表」に設定された複数のキーワードが全て含まれていれば、対応する課題および課題コードを公報データに付与するようにしている。
また、主要構成要件は、請求項1から前提部(・・・において)や一般的な単語を除去した後、従来技術に無かった新規なキーワードを多く含む文節を主要構成要件にするという考え方で抽出しているが、化学関係は式で表現されることが多く、主要構成要件を抽出出来ないことが多かった。また、従来技術の説明が抽象的で、従来技術のキーワードを抽出できないこともある。
※ このように、実際には新規なキーワードを多く含む文節が主要構成要件とは限らないが、もっとマシな方法が考えつかなったので、当面はこれを主要構成要件とし、これを課題に対する解決方法とみなすこととした。
この処理を各社の公報データについて行い、処理結果を一つのフォルダに全てまとめることにより、「課題・対策data」を作成した。
作成した「課題・対策data」はデータ量が多いため、次の2つのフォルダに分割して圧縮した。
各社の公報データから、課題、課題コード、主要構成要件を抽出するには次のプログラムを使用する。
・課題・主要構成抽出.ipynb
/
上記3つのプログラム、課題code化data、分析結果のサンプルデータを含むフォルダ「課題と解決方法の分析data」の圧縮データは以下から取得できます。
/
実際の使用方法は以下のとおり。
・課題と解決方法の分析を行う場合には、本ホームページからダウンロードしたフォルダ「課題と解決方法の分析data」内にpython本体(またはコピー)を置きます。
また、「課題・対策data」をデスクトップ上に置きます。
・・課題コード別の課題・主要構成ファイル一括作成を行う場合
・・・フォルダ「課題code化data.xlsx」のシート「課題KW表」およびシート「課題code表」を参照(または検索)し、絞り込みたい課題コードを見つける(例: L05E 情報提供支援)。
・・・改良したい現在の技術内容を文章化する。
(例: 点検すべき設備をリストにしてセンターに保持しておき、点検者がセンターから点検設備リストを携帯するモバイル端末に受信して画面に表示させ、表示にしたがって点検者が順番に点検を行い、点検結果をモバイル端末に入力すると、点検結果がセンターに送信される。)
・・・pythonを起動し、「課題コード別の課題・主要構成ファイル一括作成.ipynb」を選択し、実行する。
・・・絞り込む課題コードを入力する。
・・・改良したい現在の技術内容を入力する。
・・・この処理結果として書き出されたファイル「抽出コード+主要構成.xlsx」(例: L05E課題・主要構成.xlsx)のシート「抽出課題コード・課題KW表.xlsx」、シート「類似度」、シート「sample公報」を参照し、改良すべき課題や技術を見つける。
・・KW別の課題・主要構成ファイル一括作成を行う場合
・・・改良したい現在の技術内容を文章化する。
(例: 点検すべき設備をリストにしてセンターに保持しておき、点検者がセンターから点検設備リストを携帯するモバイル端末に受信して画面に表示させ、表示にしたがって点検者が順番に点検を行い、点検結果をモバイル端末に入力すると、点検結果がセンターに送信される。)
・・・文章化した現在の技術内容を参照し、絞り込むキーワードを決定する(例:点検)。
・・・pythonを起動し、「KW別の課題・主要構成ファイル一括作成.ipynb」を選択し、実行する。
・・・改良したい現在の技術内容を入力する。
・・・絞り込むキーワードを入力する。キーワードが複数ある場合は、「;」で結合する(例:携帯;モバイル)。
・・・公報件数が設定値1(現在は500件)より多い場合には新たなキーワードが要求されるので、新たなキーワードを入力する(入力例:センタ;送信;受信;ネット)。
・・・公報件数が設定値1(現在は100件)より多い場合には更に新たなキーワードが要求されるので、更に新たなキーワードを入力する(入力例:携帯;モバイル)。
・・・この処理結果として書き出されたファイル「KW+点検課題・主要構成.xlsx」(例:「点検課題・主要構成.xlsx」)のシート「課題コード・課題KW」、シート「new課題・主要構成KW1」・・・などを参照し、改良すべき課題や技術を見つける。