- 1 -平成20年10月28日判決言渡平成19年(行ケ)第10151号審決取消請求事件平成20年9月16日口頭弁論終結判決原告三菱電機株式会社訴訟代理人弁理士村上加奈子同吉澤憲治同大家泉被告特許庁長官指定代理人山本章裕同小林和男同奥村元宏同藤内光武主文 原告の請求を棄却する。 訴訟費用は原告の負担とする。 事実 及び 理由 第1請求特許庁が不服2006-20474号事件について平成19年3月19日にした審決を取り消す。 第2争いのない事実 特許庁における手続の経緯原告は,発明の名称を「要約再生装置および要約再生方法」とする発明につき,平成17年1月7日を国際出願日(パリ条約による優先権主張:平成16年1月14日及び平成16年2月13日アメリカ合衆国とする特許出願特,)(願2005-517009号。以下「本願」という)をした。 。 - 2 -原告は,本願につき平成18年4月3日付け手続補正書及び同年7月18日付け手続補正書(甲3)により補正をしたが(以下,同年4月3日付け手続補「」正書及び同年7月18日付け手続補正書による補正後の明細書を本願明細書という,同年8月11日付けで拒絶査定を受けたので,同年9月14日,こ。)れに対する不服の審判請求(不服2006-20474号事件)をした。特許庁は,平成19年3月19日「本件審判の請求は,成り立たない」との審決,。 をし,その謄本は,同年4月3日,原告に送達された。 本願発明本願の特許請求の範囲の請求項の数は13であり,そのうち請求項1の記載は,次のとおりである(以下,請求項1記載の発明を「本願発明」という。 。)「プログラムに含まれる映像信号及び音 本願発明本願の特許請求の範囲の請求項の数は13であり,そのうち請求項1の記載は,次のとおりである(以下,請求項1記載の発明を「本願発明」という。 。)「プログラムに含まれる映像信号及び音声信号が複数のセグメントに分割して記録されるとともに,各セグメントの映像信号または音声信号の特徴から重要度レベルが与えられ,前記重要度レベルを当該セグメントに対応付けられたメタデータに記録される記録媒体の映像及び音声を再生する再生装置であって,前記記録媒体に記録された前記メタデータから前記重要度レベルを抽出する抽出手段と,前記重要度レベルとしきい値とを比較する比較手段と,前記比較手段における比較結果に基づいて,前記重要度レベルが前記しきい値よりも高いセグメントを検索する検索手段と,前記検索手段により検索されたセグメントに対応する映像および音声を再生する再生手段と,前記プログラム内において,前記重要度レベルが前記しきい値よりも高い映像の位置を示す画像と,前記再生手段により再生される映像とを,合成して出力する合成手段とを備える再生装置」。 審決の理由の要点( )別紙審決書写しのとおりであり,要するに,本願発明は,特開平8-2 55171号公報(拒絶査定及び審決でいう刊行物1,甲4,以下「刊行物1」という)に記載された発明及び周知技術に基づいて当業者が容易に発。 - 3 -明をすることができたものであるから,特許法29条2項の規定により特許を受けることができない,というものである。 ( )審決が,本願発明に進歩性がないとの結論を導く過程において認定した 本願発明と刊行物1記載の発明(以下,刊行物1記載の発明を「刊行物1発明」という)の一致点,相違点は,次のとおりである。 。 ア一致点プログラムに含まれる映像信号及び音声信号が複数 て認定した 本願発明と刊行物1記載の発明(以下,刊行物1記載の発明を「刊行物1発明」という)の一致点,相違点は,次のとおりである。 。 ア一致点プログラムに含まれる映像信号及び音声信号が複数のセグメントに分割して記録されるとともに,重要度レベルが与えられ,前記重要度レベルを当該セグメントに対応付けられたメタデータに記録される記録媒体の映像及び音声を再生する再生装置であって,前記記録媒体に記録された前記メタデータから前記重要度レベルを抽出する抽出手段と,前記重要度レベルとしきい値とを比較する比較手段と,前記比較手段における比較結果に基づいて,前記重要度レベルが前記しきい値よりも高いセグメントを検索する検索手段と,前記検索手段により検索されたセグメントに対応する映像および音声を再生する再生手段と,前記プログラム内において,前記重要度レベルが前記しきい値よりも高い映像の位置を示す画像と,前記再生手段により再生される映像とを,合成して出力する合成手段とを備える再生装置。 イ相違点重要度レベルについては,本願発明では「各セグメントの映像信号または音声信号の特徴から・・・与えられるのに対して刊行物1では利」,,「用者の視点データから与えられる」点。 第3原告主張の取消事由- 4 -審決は,次に述べるとおり,相違点についての容易想到性判断を誤った違法がある。 阻害事由の存在について( )発明の目的・課題における相違について 刊行物1発明は,従来の情報処理装置で情報処理を自動で行う場合に「必ずしも個々の利用者に適応して処理できないという欠点があった」という課題を解決する目的で,情報の重要度レベルが利用者の視点データから与えられることとし,個々の利用者に適応して情報を処理できるようにしたものである。 これに して処理できないという欠点があった」という課題を解決する目的で,情報の重要度レベルが利用者の視点データから与えられることとし,個々の利用者に適応して情報を処理できるようにしたものである。 これに対し,本願発明は「各セグメントの映像信号または音声信号の特,徴から重要度レベルが与えられ」との構成を具え,個々の利用者に適応して情報を処理することができないものである。 そうすると,刊行物1発明の「情報の重要度レベルは利用者の視点データから与えられる」との構成を「各セグメントの映像信号または音声信号の,特徴から重要度レベルが与えられ」との構成に置き換えた場合には,個々の利用者に適応して情報を処理できないこととなり,刊行物1発明の目的・課題が達成されないことになるのみならず,その目的に反することとなる。発明の構成の一部を置き換えることによりその目的を達成することができなくなる場合に,当業者がそのような置き換えに想到するとは考えがたい。刊行物1発明の「情報の重要度レベルは利用者の視点データから与えられる」との構成を「各セグメントの映像信号または音声信号の特徴から重要度レベ,ルが与えられ」との構成に置き換えることについては,何ら動機付けがないばかりか,阻害事由がある。 以上のとおりであるから,審決が,本願発明の相違点に係る構成とすることは容易であるとした判断には誤りがある。 ( )人間による視聴・評価付けとの関係 - 5 -審決は「情報分類の自動化の根本は,人間の判断機構を代替することに,あることが認められる。刊行物1には,先ず,請求人のいう『人間による視聴・評価付けを不要とする』ことが,その根底にあると言うべきである・。 ・・すなわち,その基本志向は,人間の関与(請求人のいう『人間による視聴・評価付け)を軽減することにあると言うこと 人間による視聴・評価付けを不要とする』ことが,その根底にあると言うべきである・。 ・・すなわち,その基本志向は,人間の関与(請求人のいう『人間による視聴・評価付け)を軽減することにあると言うことができるところ,この志』,『』。」向は人間の関与を不要とすることと同じ軌条にあると言うべきである(甲1の8頁10行ないし20行)と判断している。 しかし,審決の判断は,以下のとおり誤りである。 ア刊行物1発明は,人間による視聴を利用して,個々の利用者に適応した主観的な情報価値を判断することを内容とするものであり,必ず人間の関与を必要とする。刊行物1発明は,人間による視聴を積極的に利用して主観的な重要度レベルを判定することにより,個々の利用者に適応して情報を処理できなかったという従来の情報処理装置の課題を解決するものであり,必ず人間の関与を必要とするものである。 これに対し,本願発明は「各セグメントの映像信号または音声信号の,特徴から重要度レベルが与えられ」との構成を具え「人間による視聴・,評価付け」を不要とし,情報内容だけから客観的な情報価値を判断することを内容とするものである。本願発明の「人間による視聴・評価付けを不要とする」ということは,人間の判断機構を代替することすら不要とするものであって,客観的な判断機構を与えるということを意味している。 そうすると,刊行物1発明の構成の一部である「情報の重要度レベルは利用者の視点データ眼球運動観察から与えられるという構成を各()」,「セグメントの映像信号または音声信号の特徴から重要度レベルが与えられ」との構成に置き換えると,個々の利用者に適応した主観的な情報価値を判断するという刊行物1に記載された内容が実現されないことになる。 したがって,刊行物1発明の構成を「各セグメン 要度レベルが与えられ」との構成に置き換えると,個々の利用者に適応した主観的な情報価値を判断するという刊行物1に記載された内容が実現されないことになる。 したがって,刊行物1発明の構成を「各セグメントの映像信号または,- 6 -音声信号の特徴から重要度レベルが与えられ」との構成に置き換えることについて,何ら動機付けがないばかりか,阻害事由がある。 イ確かに,刊行物1には,入力された情報の評価値を後に修正等する手段に関して,刊行物1発明に係る情報処理装置は「評価値を情報提示に即,して逐次入力,修正する手段と,入力された上記評価値のうち所定の範囲を越えざるをえない入力に対して自動修正する手段と,入力された上記評価値を利用者の順位操作に基づいて訂正する手段と,入力され,修正・変更された上記評価値に基づいて元の情報の中から提示する部分を抽出し提示する手段とを含む(甲4【0018)ことが記載されている。 」】しかし,刊行物1発明の「情報の重要度レベルは利用者の視点データから与えられる」との構成を「各セグメントの映像信号または音声信号の,特徴から重要度レベルが与えられ」との構成に置き換えるならば,個々の利用者に適応した主観的な情報価値を判断するという刊行物1発明の目的を達成できなくなるから,たとえその後に修正・変更される場合があったとしても,上記の置き換えには阻害事由があるといえる。 ウ審決は,本願発明の「各セグメントの映像信号または音声信号の特徴から重要度レベルが与えられ」との構成について「情報内容だけから自動,的に装置が判断」するものであることを肯定している。そうすると,審決は「情報内容だけから自動的に装置が判断」するということと同義であ,る「人間による視聴・評価付けを不要とする」ことも肯定しているものといえる。 ( )刊 あることを肯定している。そうすると,審決は「情報内容だけから自動的に装置が判断」するということと同義であ,る「人間による視聴・評価付けを不要とする」ことも肯定しているものといえる。 ( )刊行物2,刊行物3との組合せについて 審決は,特開2003-143546号公報(甲7,以下「刊行物2」という。なお,審決1頁の刊行物2の公開公報の番号は誤記である,特開2。)000-235652号公報(甲6,以下「刊行物3」という)の記載か。 ら,ビデオコンテンツの要約を重要度に基づいて自動的に作成するに際し,- 7 -「各セグメントの映像信号または音声信号の特徴から重要度レベルが与えられ」ることは常套手段,周知技術であり,同技術を組み合わせることによって,相違点に係る構成である「各セグメントの映像信号または音声信号の特徴から重要度レベルが与えられ」ることを容易に想到することができると判断している。 しかし,刊行物1発明の構成の一部である「情報の重要度レベルは利用者の視点データ(眼球運動観察)から与えられる」という構成を「各セグメ,ントの映像信号または音声信号の特徴から重要度レベルが与えられ」との構成(審決のいう常套手段,周知技術)に置き換えると,個々の利用者に適応した主観的な情報価値を判断するという刊行物1発明の目的を達成できなくなるので,このような置き換えを当業者が想起するとは考えられないから,審決の上記判断は誤りである。 刊行物1における示唆の有無について( )審決は「上記記載では,刊行物1の情報処理装置により得られた重要度 ,レベルを『情報内容だけから自動的に装置が判断した情報価値』と比べて,おり,これによれば『情報内容だけから自動的に装置が判断(した情報価,値』することについて,示唆があると言うべきである( ,レベルを『情報内容だけから自動的に装置が判断した情報価値』と比べて,おり,これによれば『情報内容だけから自動的に装置が判断(した情報価,値』することについて,示唆があると言うべきである(甲1の7頁14)。」行ないし17行。判決注「上記記載」とは,刊行物1(甲4)の段落【0019】の記載を指す)とする。 。 しかし,刊行物1発明は,人間の判断機構を代替するにとどまるものであり,刊行物1に「情報内容だけから自動的に装置が判断」することについ,ても示唆があるとはいえない。本願発明における「人間による視聴・評価付けを不要とする」ということは,刊行物1発明のように人間の判断機構を代替することすら不要とし,人間の主観ではない客観的な判断機構を与えることを意味すると解すべきであるから,刊行物1には,本願発明の構成について示唆はない。 - 8 -( )仮に,刊行物1により「情報内容だけから自動的に装置が判断」するこ ,とについて示唆があるとしても,本願発明の「各セグメントの映像信号または音声信号の特徴から重要度レベルが与えられ」る点についてまで示唆があるとはいえない。 顕著な作用効果について刊行物1発明は,従来の情報処理装置では必ずしも個々の利用者に適応して情報を処理できなかったという課題を解決するものにすぎず,そのためには,利用者が一度コンテンツのすべてを視聴する必要があり,初見のコンテンツでは要約再生ができない。 これに対し,本願発明は,記録媒体に記録されたビデオが視聴者にとって初見の番組である場合に,視聴者があらかじめビデオ全体における盛り上がりの傾向を把握することは不可能であることから,主観的でない重要度レベルを指定することが必要とされているという課題を解決するものであって,初見のコンテンツでも要約再生が可能で オ全体における盛り上がりの傾向を把握することは不可能であることから,主観的でない重要度レベルを指定することが必要とされているという課題を解決するものであって,初見のコンテンツでも要約再生が可能であり,素早く視聴及び分析ができるという顕著な作用効果を有する。刊行物1においては,眼球運動観察を利用して利用者が入力した評価値は,その利用者に固有のものであるから,その点からも,初見のビデオの要約再生が可能になるという本願発明の顕著な作用効果を得ることはできない。 したがって,審決の「本願発明の効果も,刊行物1および上記常套の手段から予測することができる程度のものにすぎない」との判断は誤りであり,審。 決には,本願発明の顕著な作用効果を看過した誤りがある。 第4取消事由に関する被告の反論 阻害事由の存在について( )発明の目的・課題における相違について 本願発明の「各セグメントの映像信号または音声信号の特徴から重要度レベルが与えられる」との構成は,重要度レベルが与えられる過程の具体的内- 9 -容が特定されていないから,個々の利用者に適応して処理できないものに限定されると解することはできない。 仮に本願発明において情報に重要度レベルが与えられる過程が装置分,,(析を行う装置〔メタデータ生成部75)によって行われるものであるとし〕ても,その装置による分析処理の判断基準に人的要素を反映させる余地も残されており,人的要素を反映した場合には,個々の利用者に適応して処理できるものとなる。 ( )人間による視聴・評価付けとの関係について 原告は,本願発明が「人間による視聴・評価付け」を不要とし,情報内容だけから客観的な情報価値を判断することを内容とするものである,と主張する。しかし,( )のとおり,本願発明は,情報に重要度レベルを 原告は,本願発明が「人間による視聴・評価付け」を不要とし,情報内容だけから客観的な情報価値を判断することを内容とするものである,と主張する。しかし,( )のとおり,本願発明は,情報に重要度レベルを付与する 際の判断基準に人的要素を反映する余地があるから,原告の上記主張は,本願発明の特許請求の範囲の記載に基づかないものであり,その前提において失当である。 のみならず,刊行物1においては,刊行物1発明の第1実施例について,「自動判定する」という文言が使用されていることから,視点の移動の様子から評価値(重要度レベル)を判定することも,情報分類の自動化の一つとしてとらえられており,また,刊行物1発明の第3実施例は,重要度レベルを推定する方法として眼球運動観察を利用したものであり,情報の処理作業に要する時間と労力の軽減を意図したものであって,情報分類の自動化の流れに沿うものであるから,刊行物1発明は,情報分類の自動化を進める技術であるといえる。刊行物1の記載(甲4【0002】ないし【0010)】によれば,情報分類の自動化の根本は「人間の判断機構を代替する」ことにあり,その延長上に「人間の関与を不要とする」との課題がある。 したがって,原告が本願発明についていう「人間による視聴・評価付けを不要とする」ことは,少なからず「人間の関与を不要とする」ものであるか- 10 -,「」。 ら刊行物1に記載された情報分類の自動化と同じ軌条にあるといえるなお,刊行物1発明と刊行物2,刊行物3記載の技術を結びつけることを妨げる事情の具体的な主張立証は行われていない。 刊行物1における示唆の有無について本願発明の「各セグメントの映像信号または音声信号の特徴から重要度レベ」,「」ルが与えられるという構成は情報内容だけから自動的に装置が判断する ない。 刊行物1における示唆の有無について本願発明の「各セグメントの映像信号または音声信号の特徴から重要度レベ」,「」ルが与えられるという構成は情報内容だけから自動的に装置が判断するものである。ところで,刊行物1には,情報処理を自動的に行うことが示唆されているから,刊行物1に接した当業者にとって,本願発明の上記構成を採用する動機付けが存在する。 本願発明の「各セグメントの映像信号または音声信号の特徴から重要度レベルが与えられ」との構成は,刊行物2,刊行物3等に記載された常套手段,周知技術であり,同周知技術と刊行物1発明と技術分野を共通にするから,刊行物1発明の「情報の重要度レベルは利用者の視点データから与えられる」との構成を,常套手段,周知技術である「各セグメントの映像信号または音声信号の特徴から重要度レベルが与えられ」との構成に置き換えることは,当業者が容易になし得る。 顕著な作用効果について「」刊行物1発明の情報の重要度レベルは利用者の視点データから与えられるとの構成を「各セグメントの映像信号または音声信号の特徴から重要度レベ,ルが与えられ」との構成に置き換える場合には,重要度レベルが装置の動作によって与えられることになり,初見のビデオであっても要約再生が可能になるとの効果が生ずる。しかし,そのような効果は,上記の構成の置き換えの当然の効果として予測することができる。 第5当裁判所の判断当裁判所は,以下のとおり,本願発明は刊行物1発明と周知技術(刊行物2,刊行物3)に基づいて容易に発明をすることができたとした審決に誤りはないも- 11 -のと判断する。その理由は,以下のとおりである。 阻害事由の存在について( )発明の目的・課題における相違について 原告は,刊行物1発明は,従来の情報処理装置 決に誤りはないも- 11 -のと判断する。その理由は,以下のとおりである。 阻害事由の存在について( )発明の目的・課題における相違について 原告は,刊行物1発明は,従来の情報処理装置で情報処理を自動で行う場合に「必ずしも個々の利用者に適応して処理できないという欠点があった」という課題を解決する目的で,情報の重要度レベルが利用者の視点データから与えられることとし,個々の利用者に適応して情報を処理できるようにしたものであるのに対し,本願発明は「各セグメントの映像信号または音声,信号の特徴から重要度レベルが与えられ」との構成を具え,個々の利用者に適応して情報を処理することができないものである点で,発明の目的・課題において相違するから,刊行物1発明の「情報の重要度レベルは利用者の視点データから与えられる」との構成を「各セグメントの映像信号または音,」,声信号の特徴から重要度レベルが与えられとの構成に置き換えた場合には個々の利用者に適応して情報を処理できないこととなり,刊行物1発明の目的・課題が達成されないことになると主張する。 しかし,原告の主張は,本願発明が情報を個々の利用者に適応して処理することができないものであることを前提としているが,その前提において誤りがあるから,原告の主張は失当である。 その理由は,以下のとおりである。 ア特許請求の範囲の記載本願発明における「各セグメントの映像信号または音声信号の特徴から重要度レベルが与えられ」との構成は,各セグメントの映像信号または音声信号の特徴から重要度レベルが与えられることのみを特定するものであり,入力情報である「各セグメントの映像信号または音声信号の特徴,」及び出力情報である「重要度レベル」について,具体的な内容,方法,評価基準は一切特定がない。すなわち,本願発 みを特定するものであり,入力情報である「各セグメントの映像信号または音声信号の特徴,」及び出力情報である「重要度レベル」について,具体的な内容,方法,評価基準は一切特定がない。すなわち,本願発明の特許請求の範囲では,入- 12 -力情報である「各セグメントの映像信号または音声信号の特徴」から,出力情報である「重要度レベル」に至るまでの過程に,人間による評価が反。 ,映されるような手段ないし情報を排除するような記載はないしたがって個々の利用者に適応して処理することを可能とする手段ないし情報を含めることが排除されていない以上,本願発明において「各セグメントの映,像信号または音声信号の特徴から重要度レベルが与えられ」との構成を具えることから,本願発明は情報を個々の利用者に適応して処理することができないと断定することはできない。 イ本願明細書の記載(ア)本願明細書には,重要度レベルの付与について「エンコーダは,,入力信号78~79から特徴,例えば動きベクトル,カラーヒストグラ,,,,。 ム音声周波数特性および音量ならびに音声関連情報を抽出する抽出された特徴をメタデータ生成部75によって分析し,セグメントとそれに関連する索引情報および重要度レベルを求める(甲2【00。」,52)と記載されており,これによれば,重要度レベルの付与は,メ】タデータ生成部75という装置によって行われると解される。 しかし,重要度レベルの付与が,装置による分析に基づいて行われることを前提としても,その分析の基準の設定に当たって,人間が示す反応など人的要素を反映させることが排除されることを意味するものではない。人的要素を反映させることができる以上,情報を個々の利用者に適応して処理することは可能である。 (イ)また,本願明細書には 反応など人的要素を反映させることが排除されることを意味するものではない。人的要素を反映させることができる以上,情報を個々の利用者に適応して処理することは可能である。 (イ)また,本願明細書には「各セグメントの映像信号または音声信号,の特徴から重要度レベルが与えられ」との構成について,次のとおりの記載がある。 a「重要度レベルウィンドウ例えば,図12に示すように,重要度レベルは,音声信号を用いる- 13 -ことによって求めることができる。例えば,各セグメント1201の音量を用いることができ,さらに,各セグメント1201の音声信号を様々なクラス(音声,音楽,歓声,拍手,笑い声等)に分類することができる。この場合,コンテンツ1200全体を重複しないセグメント1201(例えば1秒の持続時間)に分割する。拍手および歓声には,音声や音楽よりも高い重要度レベルを与えることができる」。 (甲2【0053),】b「次に,ウィンドウ内の連続した拍手および/または歓声の最長の長さを求めることによって,あるいはウィンドウ内の拍手および/または歓声の割合(パーセンテージ)を求めることによって,各ウィンドウの重要度レベルを計算することができる。ウィンドウ内の全ての区間にウィンドウの重要度レベルを与えることができる甲2 ,。」(,【055)】c「重み付き()重要度レベルWeightedさらに,上記の方策により得られた重要度レベル(IL)を,ウィンドウの係数(例えば音量1211)でさらに重み付けして(121),。 , 最終的な重要度レベルを得ることができるしたがって例えばあるセグメントが多数の音量の低い拍手を含む場合,そのセグメントには比較的低い重要度レベルが与えられるが,非常に大きな拍手を有するセグメントには比較的高 度レベルを得ることができるしたがって例えばあるセグメントが多数の音量の低い拍手を含む場合,そのセグメントには比較的低い重要度レベルが与えられるが,非常に大きな拍手を有するセグメントには比較的高い重要度レベルが与えられる。 なお,スポーツ番組などの場合,得点シーンや得点するチャンスにおいては,拍手や歓声のほかにアナウンサーや解説者による絶叫音声が伴う場合が多い。よって,スポーツ番組などの場合には,拍手や歓声を含む絶叫音声を1つの音声クラスとして設定し,当該音声クラスを重要度レベルの算出に使用することも有効である(甲2【00。」,57】ないし【0058)】- 14 -d「具体的に説明すると,例えば,要約再生するビデオがスポーツ番組であって,当該スポーツ番組の映像の特徴を示すパラメータを『歓声の継続時間』として重要度レベルを算出した場合,重要度レベルプロット135は前記スポーツ番組における歓声の継続時間の変化を表すことになる。スポーツ番組等においては,勝敗の行方を左右するシーンであるほど歓声や拍手が継続する。したがって,ユーザーは,当該重要度レベルプロット135を一目見ただけで当該スポーツ番組における重要なシーンの番組全体における位置を把握でき,当該スポーツ番組における盛り上がりの傾向を一目で把握することができる(甲。」2【0087),】以上によれば,本願明細書には,本願発明の実施例として,会場にいる多数の観客やアナウンサー等が発する,歓声や拍手等の音声信号を,クラスに分類し,音量等を加味して,重要度レベルを与えることが記載されている。 実施例における重要度レベルの付与の方法は,番組の視聴者が意識的に示す評価を直接的に重要度レベルの判定に反映するものではないが,会場にいる観客やアナウンサーといった人間の,歓声や拍 載されている。 実施例における重要度レベルの付与の方法は,番組の視聴者が意識的に示す評価を直接的に重要度レベルの判定に反映するものではないが,会場にいる観客やアナウンサーといった人間の,歓声や拍手等の自然な反応(そこには,無意識のうちにも,人間の評価が反映されるものと認められる)に基づいて重要度レベルを与えるものが示されていること。 に照らすならば「各セグメントの映像信号または音声信号の特徴から,重要度レベルが与えられ」との構成に,人間による反応(評価)を重要度レベルの付与に反映する情報を付加することを排除するものではないと解される(本願発明において,人間による反応〔評価〕を重要度レベ,。)。 ルの付与に反映する方法は上記の実施例に限定されるものではないそして,人間による反応(評価)を重要度レベルの付与に反映する場合の重要度レベルの判断基準を,個々の利用者に適応するものとするな- 15 -らば,本願発明は,刊行物1発明と同様に,情報を個々の利用者に適応して処理することができるものと認められる。 ウ小括以上によれば,本願発明の「各セグメントの映像信号または音声信号の特徴から重要度レベルが与えられ」との構成は,重要度レベルを与えるか否かの判断基準に人間による評価が反映され,情報を個々の利用者に適応して処理することができるものを排除するものではないから,情報を個々の利用者に適応して処理することができないとはいえない。 そうすると,本願発明は情報を個々の利用者に適応して処理することができないものであることを前提とする原告の主張は,前提において採り得ない。したがって,上記主張を前提として,刊行物1発明の「情報の重要度レベルは利用者の視点データから与えられる」との構成を,本願発明の「各セグメントの映像信号または音声信号の特徴から重要 いて採り得ない。したがって,上記主張を前提として,刊行物1発明の「情報の重要度レベルは利用者の視点データから与えられる」との構成を,本願発明の「各セグメントの映像信号または音声信号の特徴から重要度レベルが与え」,,られとの構成に置き換えることについて何ら動機付けがないばかりか阻害事由があるとの原告の主張も,採用することはできない。 ( )人間による視聴・評価付けとの関係について ア原告は,刊行物1発明は,人間による視聴を利用して,個々の利用者に適応した主観的な情報価値を判断することを内容とするものであるのに対して,本願発明は「各セグメントの映像信号または音声信号の特徴から,」,「」重要度レベルが与えられとの構成を具え人間による視聴・評価付けを不要とし,情報内容だけから客観的な情報価値を判断することを内容とするものである点で相違し,刊行物1発明の構成の一部である「情報の重要度レベルは利用者の視点データ(眼球運動観察)から与えられる」という構成を「各セグメントの映像信号または音声信号の特徴から重要度レ,ベルが与えられ」との構成に置き換えると,個々の利用者に適応した主観的な情報価値を判断するという刊行物1に記載された内容が実現されない- 16 -ことになるから,阻害事由があると主張する。 しかし,原告の主張は,本願発明が情報を個々の利用者に適応して処理することができないものであるとの理解を前提とするが,原告の主張の前提において,誤りがあるから,その主張自体失当である。その理由は,前記( )アないしウ記載のとおりである。 イ原告は,審決が「刊行物1の基本志向は,人間の関与を軽減すること,,,『』」にありこの志向は人間の関与を不要とすることと同じ軌条にある旨述べたこと(甲1の8頁10行ない イ原告は,審決が「刊行物1の基本志向は,人間の関与を軽減すること,,,『』」にありこの志向は人間の関与を不要とすることと同じ軌条にある旨述べたこと(甲1の8頁10行ないし20行)に対し,刊行物1発明は必ず人間の関与を必要とするものであって,人間の関与を不要とすることとは同じ軌条にはない旨主張する。 しかし,原告の上記主張は,以下のとおり失当である。 ,【】【】,すなわち刊行物1の0002ないし0010の記載によれば刊行物1は「多種多量の情報から簡便な操作で効率よく利用者が必要と,する情報を加工,提示することのできる情報処理装置を提供することを目的とする」ものであると記載され,自動化を目的の一つとするものであるから,刊行物1発明は,人間の関与を不要とすることにおいて,本願発明と共通するしたがって審決が刊行物1発明の志向が人間の関与を不。 ,,「要とする」ことと同じ軌条にあると述べたことは誤りとはいえない。 ウ原告は,審決は,本願発明の「各セグメントに映像信号または音声信号の特徴から重要度レベルが与えられ」との構成が「情報内容だけから自動的に装置が判断」するものであることを肯定しているから,これと同義である「人間による視聴・評価付けを不要とする」ものであることも審決が肯定していると主張する。 しかし,原告の上記主張も,以下のとおり失当である。 確かに,審決には「上記記載では,刊行物1の情報処理装置により得,られた重要度レベルを『情報内容だけから自動的に装置が判断した情報,- 17 -価値』と比べており,これによれば『情報内容だけから自動的に装置が,()』,。」判断した情報価値することについて示唆があると言うべきである(甲1の7頁14行ないし17行)と記載されている。 値』と比べており,これによれば『情報内容だけから自動的に装置が,()』,。」判断した情報価値することについて示唆があると言うべきである(甲1の7頁14行ないし17行)と記載されている。しかし,審決の上記記載部分は,刊行物1により示唆された「情報内容だけから自動的に装置が判断(した情報価値」することと本願発明の「各セグメントに映像)信号または音声信号の特徴から重要度レベルが与えられ」ということが,構成において一致するとしているものでもなく,また,本願発明の上記構成が「人間による視聴・評価付けを不要とする」ものであるとしている,わけではない。したがって,審決に内容において不適切な記載はなく,この点についての原告の主張は,失当である。 ( )刊行物2,刊行物3との組合せについて 原告は,刊行物1発明の構成の一部である「情報の重要度レベルは利用者の視点データ(眼球運動観察)から与えられる」という構成を,刊行物2,刊行物3などに表された「各セグメントの映像信号または音声信号の特徴から重要度レベルが与えられ」との構成(常套手段,周知技術)に置き換えると,個々の利用者に適応した主観的な情報価値を判断するという刊行物1発明の目的を達成できなくなるので,このような置き換えを当業者が想起するとは考えられないから,審決の上記判断は誤りである,と主張する。 しかし,原告の上記主張は,以下のとおり失当である。 ア刊行物2の記載(甲7【0052,刊行物3の記載(甲6【00,】),15)などから,本願発明の構成である「各セグメントの映像信号また】は音声信号の特徴から重要度レベルが与えられ」ることは,常套手段,周知技術であり,刊行物2及び刊行物3には,上記構成と同様の趣旨が記載されていることが認められる。そして,前記( )のとおり,本 】は音声信号の特徴から重要度レベルが与えられ」ることは,常套手段,周知技術であり,刊行物2及び刊行物3には,上記構成と同様の趣旨が記載されていることが認められる。そして,前記( )のとおり,本願発明にお ける「各セグメントの映像信号または音声信号の特徴から重要度レベルが与えられ」る構成には,重要度レベルを与えるか否かの判断基準に人間に- 18 -よる評価が反映され,情報を個々の利用者に適応して処理することができるものが排除されていない。そうすると,刊行物1発明の構成の一部である「情報の重要度レベルは利用者の視点データ(眼球運動観察)から与えられる」という構成を,刊行物2,刊行物3などに表された常套手段である「各セグメントの映像信号または音声信号の特徴から重要度レベルが与えられ」との構成に置き換えても,個々の利用者に適応した主観的な情報価値を判断するという刊行物1発明の目的を達成できなくなるものではない。したがって,原告の前記主張は,採用することができない。 イ組合せの容易想到性について,敷衍する。 a刊行物2には,ビデオコンテンツの要約(ダイジェスト)を情報の重要度に基づいて自動的に作成することに関し「効果的なフットボール,の要約は“プレー”のコンセプトに基づくが,視聴者は最もエキサイティングなプレーを含めたより短い要約を好む場合がある。1つのプレーの興奮度を推定する1つの有力な技法は,セグメントについて統計学的な分析を行い,どの時間が最も高い興奮度を持つ可能性が最も高いかを決定する方法である。しかしながら,この技法は,多分,十分に正確な結果を提供し得ない。さらに,興奮度は主観的な測度の傾向が強く数量化が難しい。さらに検討を重ね,本発明では,ビデオと共に提供される音声信号がそのプレーの興奮度のよき指標であることに着目し 分に正確な結果を提供し得ない。さらに,興奮度は主観的な測度の傾向が強く数量化が難しい。さらに検討を重ね,本発明では,ビデオと共に提供される音声信号がそのプレーの興奮度のよき指標であることに着目した。例え,。 ば観衆の及び/または解説者の反応の音量は興奮度を良く示している観衆及び/または解説者の声が大きければ大きい程,興奮度も大きいことが判る(甲7【0052)と記載されている。 。」,】また,刊行物3には「各メディアの重要度は,予め各データの例え,ば種類に応じて重要度として定義されているか,メディア同期データに定義されているか,そのメディアデータの持つ付加情報から求められる,,。 かもしくは単純に各メディアデータを同じ重み付けであってもよい- 19 -要はメディアの重要度を示すものであればよい。メディアの付加情報から求める場合には,静止画,動画,テキスト等の表示を行うデータでは例えば表示領域の大きさ,音声データでは音量の大きさと重要度とが比例すると考えてもよい(甲6【0015)と記載されている。 。」,】さらに,乙2(佐野雅規,住吉英樹,井上誠喜「映像版スコアブッ,クの検討~新しいスポーツ映像管理を目指して~,社団法人電子情」報通信学会,年月)にも「会場全体の音声は,観客の興奮度と2000 ,深く関わりがあると考えられ,今回盛り上がった部分などを示す『雰囲』。 。 気インデックスの生成を試みた図3が生成のフローチャートである,,.」まず録音した音声に対して瞬時パワーの計算と周波数解析を行う(87頁左欄23ないし28行「これらの結果から,本手法はダイジ),. ,ェスト番組の候補抽出に適していると判断する今回この結果をもとにIn点の10秒前からOut点の5秒あとまでを連続的につな (87頁左欄23ないし28行「これらの結果から,本手法はダイジ),. ,ェスト番組の候補抽出に適していると判断する今回この結果をもとにIn点の10秒前からOut点の5秒あとまでを連続的につなげたクリップを作成したところ,前半47分の試合を約4分半で全ての盛り上がり部分を含むダイジェスト版を作成することに成功した(88頁左欄.」28ないし34行)と記載されている。 以上の記載によれば,ビデオコンテンツの要約(ダイジェスト)を情報の重要度に基づいて自動的に作成するに当たり「各セグメントの映,像信号または音声信号の特徴から重要度レベルが与えられ」ることは,常套手段,周知技術であると認められる。 b刊行物1発明と,刊行物2,刊行物3などに記載された常套手段,周知技術は,情報の重要度レベルに基づいてビデオコンテンツの要約を作成する点において共通する技術である。 cそうすると,刊行物1には,情報処理を自動的に行うことが示唆されているから,本願発明の構成(各セグメントの映像信号または音声信「号の特徴から重要度レベルが与えられ」との構成)を採用する動機付け- 20 -があるといえる。したがって,刊行物1発明の「情報の重要度レベルは利用者の視点データから与えられる」との構成を,技術分野を共通にする常套手段,周知技術である「各セグメントの映像信号または音声信号の特徴から重要度レベルが与えられ」との構成に置き換えることは,当業者が容易に想到し得ると認められる。 刊行物1における示唆の有無について原告は,審決が「上記記載では,刊行物1の情報処理装置により得られた重要度レベルを『情報内容だけから自動的に装置が判断した情報価値』と比べ,ており,これによれば『情報内容だけから自動的に装置が判断(した情報価,値』することについて,示唆が 理装置により得られた重要度レベルを『情報内容だけから自動的に装置が判断した情報価値』と比べ,ており,これによれば『情報内容だけから自動的に装置が判断(した情報価,値』することについて,示唆があると言うべきである(甲1の7頁14行)。」ないし17行)とした点に誤りがあると主張する。 しかし,原告の上記主張は,以下のとおり失当である。 刊行物1には,刊行物1発明の作用につき「作用】本発明に係る情報処理,【装置によれば,利用者が独自の基準で情報に対して抱いている,例えば『重要である/ない』等といった評価値を,同一画面内において提示されている情報と関連づけて入力修正処理を行う。このため,画像分析,音声認識等の高度な情報処理を多く用いることなく,利用者にとっての情報価値を得ることができる。また,このようにして入力された上記評価値は,自ずと利用者に固有のものであって,情報内容だけから自動的に装置が判断した情報価値と比べても,より利用者に適応していることが期待できる(甲4【0019)と記載。」,】されている。このように,刊行物1に「情報内容だけから自動的に装置が判断した情報価値と比べても」と記載されていることから,刊行物1には,情報処理を自動的に行うことが示唆されているものと認められる。 そうすると,審決は,本願発明の「各セグメントの映像信号または音声信号の特徴から重要度レベルが与えられ」との構成は,装置の動作により重要度レベルが与えられる態様を排除するものではなく,他方,刊行物1には,情報処- 21 -理を自動的に行うことが示唆されていることから「情報内容だけから自動的,に装置が判断する」ものに該当する本願発明の上記構成(各セグメントの映「像信号または音声信号の特徴から重要度レベルが与えられ」との構成)を採用する動機付け いることから「情報内容だけから自動的,に装置が判断する」ものに該当する本願発明の上記構成(各セグメントの映「像信号または音声信号の特徴から重要度レベルが与えられ」との構成)を採用する動機付けがあると判断し,その趣旨を上記記載部分(甲1の審決7頁14行ないし17行)において述べたものと解されるから,審決には誤りはない。 また,前記1のとおり,本願発明の「各セグメントの映像信号または音声信号の特徴から重要度レベルが与えられ」との構成は,情報処理を自動化する一方で,重要度レベルを与えるか否かの判断基準に人間による評価が反映され,情報を個々の利用者に適応して処理することができるものを含むと認められるから,本願発明における「人間による視聴・評価付けを不要とする」との意味は,情報処理の自動化を意味するとしても,それ以上に,人間の判断機構を代替することすら不要としたり,人間の主観ではない客観的な判断機構を与えることを意味するものとは解されない。 したがって,原告の前記主張は,採用することができない。 なお,原告は,仮に刊行物1により「情報内容だけから自動的に装置が判,断」することについて示唆があるとしても,本願発明の「各セグメントの映像信号または音声信号の特徴から重要度レベルが与えられ」る点についてまで示唆があるとはいえないとも主張する。しかし,刊行物1に,本願発明の「各セグメントの映像信号または音声信号の特徴から重要度レベルが与えられ」る点について示唆があるか否かによって,審決の判断の適法性が左右されるものではなく,原告の主張は採用の余地はない。 顕著な作用効果について刊行物1発明においては,情報の重要度が利用者の視点データにより与えられるから,利用者が重要度レベルを与える者として行動する場合には,コンテンツを一度すべて視聴する必要があ 顕著な作用効果について刊行物1発明においては,情報の重要度が利用者の視点データにより与えられるから,利用者が重要度レベルを与える者として行動する場合には,コンテンツを一度すべて視聴する必要がある。これに対し,刊行物2,刊行物3を組み合わせることにより本願発明の「各セグメントの映像信号または音声信号の- 22 -特徴から重要度レベルが与えられ」との構成を採用する場合は,装置の動作により重要度レベルが与えられるから,利用者がコンテンツの視聴などによって重要度レベルを与える者として行動する必要はなくなり,その結果,初見のビデオでも要約再生が可能となる。そして,この初見のビデオでも要約再生が可能になるとの効果は,置き換えによる当然の効果として容易に予測できるといえる。 そうすると,審決の示した「本願発明の効果も,刊行物1および上記常套の」,手段から予測することができる程度のものにすぎないとの判断に誤りはなく審決には,本願発明の顕著な作用効果を看過した誤りはない。 結論 以上のとおり,原告の主張する取消事由はいずれも理由がなく,審決に,これを取り消すべきその他の違法もない。その他,原告は,縷々主張するがいずれも理由がない。 よって,原告の本訴請求を棄却することとし,主文のとおり判決する。 知的財産高等裁判所第3部裁判長裁判官飯村敏明裁判官中平健裁判官上田洋幸
▼ クリックして全文を表示