Nishika/Nishikaが新たなデータサイエンスコンペティション「判例の個人情報の自動マスキング」を開始

データサイエンスコンペティションを中心としたプラットフォーム”Nishika”を運営するNishika株式会社(東京都千代田区、代表取締役山下達朗、以下Nishika)が本日より新たなコンペティション「判例の個人情報の自動マスキング」(以下本コンペ)をスタート致しました!Nishikaではこれが6回目のコンペ開催になり、これまで1500人のデータサイエンティストが国内外から参加しています。

・URL:https://www.nishika.com/competitions/7/summary
・締切:2021/01/14
・賞金総額:16万円

本コンペでは裁判記録(以下判例)に記載されている個人情報を自動で抽出して分類するタスクに挑戦して頂きます。BERTなど最新の自然言語処理技術を活用した、個人情報の自動抽出という様々な領域で必要とされるタスクに挑戦して頂きます。

【本コンペ概要】
 最高裁判所や地方裁判所では日々様々な裁判が行われております。これら日々の裁判の記録である判例は、現行の司法制度において重要な役割を果たしています。
 
 判例を広く公開することは、法律解釈における一貫性を保つという点で社会にとって必要なものであると言えます。実際、多くの判例が裁判所のホームページや商用データベース、雑誌・判例集などで公開されており多くの方々に利用されています。

 一方で、判例には個人が特定可能な氏名や組織名が記載されていたり、住所や日付など個人の特定に繋がり得る情報を多く含んでいることが多く、プライバシー保護の観点からそのままの状態で公開されるべきではありません。そのため、個人情報や個人の特定に繋がり得る情報については、“A氏”や“●年●月●日” のような形で適切にマスキングを行う必要があります。
 
 現在日本では、刑事事件、民事事件等を合計すると年間で350万件を超える裁判が行われていますが、公開されている判例はこの内の僅か数%に過ぎません。

 従来はこの個人情報の特定とマスキング作業は主に人手によって行われてきましたが、機械学習により判例の中の個人情報を自動で抽出し、適切にマスキングできれば、大幅な業務効率化が期待でき、判例データベースの充実化に繋がります。

【データサイエンスコンペティションについて】
データサイエンスコンペティションは、AIやビッグデータの解析モデルをオープンイノベーション方式で開発する仕組みのことで、最高精度のAIモデルが開発可能なためアメリカや中国においてAI開発の新たな手法として普及しています。
 

企業から提出されたデータセットを、Nishikaに登録しているデータサイエンティスト達が各々解析し、AIモデルを作成。モデルの精度はリアルタイムで評価・ランキング化されます。企業は最も性能が良いAIモデルを賞金と引き換えに獲得できます。主な用途には、ECサイトなどにおけるリコメンドエンジンの開発、製造業などにおける異常検知や需要予測、株価や不動産などの将来価格予測などに加え、画像解析や自然言語処理などのAIモデルの開発があり、非常に幅広く活用されています。

Nishikaではこれまでリコメンドエンジンの開発や株価予測など6つのデータサイエンスコンペティションの開催実績があります。

【Nishika株式会社について】

2019年5月に設立。AI・データサイエンスに特化したコミュニティプラットフォーム「Nishika」を運営している。
URL :https://www.nishika.com/
所在地 : 東京都港区芝浦3-7-8-202
代表者 : 代表取締役CEO 山下達朗、代表取締役CTO 松田裕之
事業内容:コンペティションによるAI開発, データサイエンスQ&Aサイト運営, データサイエンティストに特化した求人メディアサイト運営, 受託によるAI開発・コンサルティング

【本リリースに関するお問合せ先】

Nishika株式会社 担当 : 山下
E-mail:info@nishika.com