01_logistic_regression.sdcproj:
ロジスティック回帰を用いて、数字の4と9を判別させる。
datasetについて、Trainingは「small_mnist_4or9_training.csv」、Validationは「small_mnist_4or9_test.csv」を用いた。
Input (IO Layer)
Size: 画像入力の場合、「色数、高さ、幅」のフォーマットで表されるので、この場合モノクロで、28×28の画像サイズの入力を示す。
Dataset: データが入っている変数(x)。この場合、datasetで見るとx:imageのところに画像が入っていることが分かる。
Affine (Basic Layer)
Affine変換を用いた全結合層
人工ニューロンは
y=f(Σwx+b)と表現されるが、この()内がAffineであり、fの部分が活性化関数となる。
なので、おおまかな流れとしては判別対象が2つの場合は「Affine」「sigmoid」「binary cross entropy」となり、最終的な識別対象が2個以上の場合は「Affine」「softmax」「multicategory cross entropy」となる。
人工ニューロンは
y=f(Σwx+b)と表現されるが、この()内がAffineであり、fの部分が活性化関数となる。
なので、おおまかな流れとしては判別対象が2つの場合は「Affine」「sigmoid」「binary cross entropy」となり、最終的な識別対象が2個以上の場合は「Affine」「softmax」「multicategory cross entropy」となる。
Sigmoid(Activation Layer)
Sigmoid関数によるアウトプット。Affine変換を使って28×28の行列は内積計算しているので、Inputは1つ、Output1つの活性化関数となる。
BinaryCrossEntropy (Loss layer)
Input:1(値は0~1の間を取り、0に近いと数字4の確率が上がり、1に近いと数字9の確率が上がる。)
T.Dataset: データセットに含まれる変数のうち、このレイヤーの出力として期待する変数の変数名を指定します。
T.Generator:データセットの変わりに用いるGeneratorを指定。この場合、Noneなのでデータ生成を行わない。
T.GeneratorMultiplier:Generatorにより生成した値に対して掛ける係数を指定する。この場合、1となっている。(0に設定しても計算できていた。)
T.Dataset: データセットに含まれる変数のうち、このレイヤーの出力として期待する変数の変数名を指定します。
T.Generator:データセットの変わりに用いるGeneratorを指定。この場合、Noneなのでデータ生成を行わない。
T.GeneratorMultiplier:Generatorにより生成した値に対して掛ける係数を指定する。この場合、1となっている。(0に設定しても計算できていた。)
0 件のコメント:
コメントを投稿