Describing Words

Describing Words

関連語 (類語辞典のようなものですが、単なる同義語ではなく、より幅広い関連語のセットを提供します) のエンジンを構築していたとき、Describing Words エンジンのアイデアが浮かびました。 単語ベクトルとconceptnetの「HasProperty」APIで遊んでいるときに、ある単語をよく表す形容詞を取得するのが楽しくて仕方なかったんです。

Project Gutenberg が最初のコーパスでしたが、パーサーはどんどん欲張り、最終的に約 100 ギガバイトのテキスト ファイルを与えることになりました。

願わくば、これが単なる目新しさではなく、実際に執筆やブレーンストーミングに役立つと感じる人が出てきてほしいのですが、試してみたいちょっとしたことは、似ているが何らかの重要な点で異なる 2 つの名詞を比較することです。 例えば、「女」対「男」、「男」対「女」などです。 ざっと分析したところ、フィクションの作者は、(男性に対して)少なくとも4倍は女性を美に関する用語(体重、特徴、一般的な魅力に関するもの)で表現する傾向があるようです。 実際、「美しい」という表現は、世界中の文学作品の中で最も広く使われている表現であり、他の多くのメディアにおける女性の一般的な一面的表現と非常によく一致しています。

結果の青さは、その相対的な頻度を表します。

結果の青さは相対的な頻度を表します。 一意性」の並べ替えはデフォルトで、私の複雑なアルゴリズムのおかげで、他の名詞と比較して、その特定の名詞に対する形容詞の一意性によって並べ替えられます (実際にはかなり単純です)。 ご期待どおり、「使用頻度で並べ替え」ボタンをクリックすると、その名詞に対する使用頻度で形容詞を並べ替えることができます

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です