トピックモデルで単語の分散表現 – 実装編

scouty代表の島田です。 前回の記事 トピックモデルで単語の分散表現 – 理論編 では、トピックモデル・LDA(Latent Dirichlet Allocation)の基本構造とアイディアを、非エンジニアにも比較的わかりやすく説明しました。 今回はPythonで実際にトピックモデルを使って単語の分散(ベクトル)表現を作ってみます。エンジニア向けの記事ですが、最後の性能比較の部分はエンジニアで …

2017-08-07

トピックモデルで単語の分散表現 – 理論編

こんにちは。代表の島田です。 最近はDeepLearningがホットなキーワードになっていますが、トピックモデルという自然言語処理における手法も、少し前に注目を集めました。聞いたことはあるけど何なのかわからない、という方のために、今回はトピックモデルに関して説明します。 Pythonなどの言語ではライブラリが利用できますが、トピックモデルなどの原理を知っておくことでパラメータチューニングが思いのま …

CNNで文の識別タスクを解く

代表の島田です。 今回は、今後scoutyでもスカウトメールの返信率予測などに利用していこうと考えているCNN(畳み込みニューラルネットワーク)の自然言語処理分野への応用をご紹介します。 画像認識に使われることも多いCNNですが、最近は自然言語処理への応用もさかんです。 CNNとは 畳み込みニューラルネットワーク(Convolutional Neural Network:以下CNN)は、画像認識で …

クロスエントロピーで名前から国籍判定する

scouty代表の島田です。 「競合優位性に関わる技術でない限り技術情報をオープンにしていく」というポリシーのもと、今回は、scoutyのサービス内で実際に使われている、「名前の文字列からその人の国籍を判定する」というアルゴリズムを紹介します。 初回ということもあり、非技術者の方にもわかりやすくscoutyで使っている技術をご紹介したいと思います。 アルゴリズム概要 平たく言うと、今回ご紹介するの …

2017-05-13

scouty AI LAB について

株式会社scoutyについて 皆様、はじめまして。株式会社scouty 代表取締役 島田寛基と申します。 弊社は、2016年5月に創業したばかりのHR Tech(人材分野の問題をテクノロジーで解決しようとする分野)のスタートアップで、機械学習や自然言語処理・統計やデータマイニングをはじめとする人工知能技術の力で採用を効率化し、IT企業の採用活動をお手伝いするサービスを提供しております。 私代表の島 …