KEMBAR78
第7回スキル養成講座講義スライド | PDF
データビジネス創造コンソーシアム
スキル養成講座
早稲田大学高等研究所 講師 社本陽太
応用と学ぶ線形代数 (第1回)
講師の自己紹介
• 社本 陽太 (しゃもと ようた)
• 普段は数学の研究をしています.
• 普段は理論として線形代数を利用.
• 今回の内容は「使って」はいない.
• 慶応SFCで線形代数の授業をしたことが
きっかけで, この講座の講師に.
C
・ ・
x
A
授業が終わってバカンスを楽しんだ線形代数の出演者たち
質問とか受け方
• 想定する受講者は, 大学1,2回生. 高校生や高回生も歓迎.
• 高校数学のI(2次方程式), B(ベクトル, Σ記号)を想定.
• しかし, 別に覚えていなくてわからなければ聞けばOK.
• 質問は, 手を上げる, または, チャットで聞いてください.
• プライベートチャットで質問してもOK. チャットの内容のみをコピペして
みなさんと共有します.
「応用と学ぶ」
• 「どのように使われるか」を実感してもらうことが目標.
• 理論的な事実は, 主張とイメージ, 例を説明するが, 証明はしない.
• 応用例は, 特徴的な例(主成分分析)を一つ与えるのみ.
• 各自の文脈でどう使えるかを考えて取り組んでください.
「線形代数」
• 「線形な関係」に関する代数学.
• (線形)=(1次関数の一般化) (右図).
• 講座では, 「ベクトルと行列に関する数学」
という認識でOK.
• ベクトルと行列については, 後ほど.
• SFCの講義であまり深く教えなかった,
「内積, ノルム, 対称行列」に重点.
y = ax
3回のプラン
1. イントロと準備.
2. 主成分分析の考え方と線形代数.
3. 主成分分析の背景にある, あるアルゴリズム.
注意事項
• 先述の通り, 講師は主成分分析のプロではありません.
• 線形代数についても, この講座で全てのエッセンスを学ぶことは不可能.
• 目的は, あくまでイントロダクション.
• この講座を「出発点」として, 学んでいかれることを願っています.
!
参考書籍
• 応用がみえる線形代数 高松 瑞代 著 (岩波)
• 線形代数の入門から応用までをわかりやすく
扱っている教科書.
• 本講座では「テキスト」といったらこの本.
• この講座では, 6の解説を目標とする.
• 今日はそのための準備とイントロ.
行列とベクトル
線形代数の登場人物
A x
ベクトル
行列 縦横に並んだ数の組. 一列に並んだ数の組.
0
@
1 2 0 1 0
0 4 2 0 0
1 0 0 1 2
1
A
例:
1行
2行
3行
1
列
2
列
3
列
4
列
5
列
例:
列ベクトル
行ベクトル
1 2 0 1
3 5行列と呼ぶ
4次元
0
@
1
2
3
1
A
3次元
特
別
な
場
合
講座を通して考える問題
都市の比較分析
都市項目 生活の利便性 安心・安全 医療・介護 教育
都市1 6.0 2.7 2.1 6.5
都市2 6.7 2.2 2.5 6.4
都市3 5.9 3.0 1.9 6.5
都市4 6.6 5.0 2.4 6.8
都市5 7.0 2.6 2.5 6.0
都市6 8.1 4.2 4.5 6.3
都市7 7.2 2.8 2.5 6.2
都市8 7.0 3.1 2.5 5.9
都市9 7.2 2.5 2.1 5.4
都市10 5.6 2.2 1.8 4.5
都市1〜10に対して, 以下の4項目を10点満点で評価した結果,
以下の表のようになった. このデータから, 何を読み取れるか?
考え方: このデータの「特徴」をよく表した新しい評価値を与える.
: 都市 i の生活の利便性の評価値
evw(xi) = w1xi1 + w2xi2 + w3xi3 + w4xi4
evw(xi) = w1xi1 + w2xi2 + w3xi3 + w4xi4
vw(xi) = w1xi1 + w2xi2 + w3xi3 + w4xi4
w1xi1 + w2xi2 + w3xi3 + w4xi4
: 都市 i の 安心・安全 の評価値
: 都市 i の 医療・介護 の評価値
: 都市 i の 教育 の評価値
新しい評価値
各評価値に与える
重み(weight).
evw(xi) = w1xi1 + w2xi2 + w3xi3 + w4xi4
講座を通して考える問題
都市の比較分析
考え方: このデータの「特徴」をよく表した新しい評価値を与える.
例. w1 = w2 = w3 = w4 = 0.5
evw(xi) = w1xi1 + w2xi2 + w3xi3 + w4xi4
講座を通して考える問題
都市の比較分析
: 都市 i の生活の利便性の評価値
evw(xi) = w1xi1 + w2xi2 + w3xi3 + w4xi4
evw(xi) = w1xi1 + w2xi2 + w3xi3 + w4xi4
evw(xi) = w1xi1 + w2xi2 + w3xi3 + w4xi4
evw(xi) = w1xi1 + w2xi2 + w3xi3 + w4xi4
: 都市 i の 安心・安全 の評価値
: 都市 i の 医療・介護 の評価値
: 都市 i の 教育 の評価値
evw(x1) =0.5 · 6.0 + 0.5 · 2.7
+ 0.5 · 2.1 + 0.5 · 6.5
=8.65
10点満点ではない
行列やベクトルの現れ方
「重み」のベクトル
都市の評価値ベクトル 新しい評価値
講座を通して考える問題
都市の比較分析
xi =
0
B
B
@
xi1
xi2
xi3
xi4
1
C
C
A
w1 =
0
B
B
@
0.4733
0.6156
0.5387
0.3270
1
C
C
A
w1 =
0
B
B
@
0.4733
0.6156
0.5387
0.3270
1
C
C
A
生活の利便性
安心・安全
医療・介護
教育
xi =
0
B
B
@
xi1
xi2
xi3
xi4
1
C
C
A
例.
w =
0
B
B
@
w1
w2
w3
w4
1
C
C
A
evw(xi) = w · xi
=
4
X
j=1
wjxij
内積
後で詳述
例. 例.
x1 =
0
B
B
@
6.0
2.7
2.1
6.5
1
C
C
A x5 =
0
B
B
@
7.0
2.6
2.5
6.0
1
C
C
A
, w =
0
B
B
@
0.5
0.5
0.5
0.5
1
C
C
A
evw(x1) =0.5 · 6.0 + 0.5 · 2.7
+ 0.5 · 2.1 + 0.5 · 6.5
=8.65
Q. どんな重みをつけた新しい評価値が, 「良い評価値」なのか?
主成分分析の考え方: 「結果に差が出る評価値」が良い評価値.
今回の評価は, 4項目もあるので, 比較が大変.
→ より結果の特徴を捉えた, 2つの評価値を選んで, 分析.
「分散」が大きい.
講座を通して考える問題
都市の比較分析
講座を通して考える問題
都市の比較分析
行列やベクトルの現れ方
標本分散共分散行列S…与えられたデータから決まる行列.
重みベクトルwに対して, 得られる評価値の分散を,
t
wSw
という式で与えられるようなもの.
後で詳述. 今は眺める.
Q. この二つの評価は, どういう根拠で出てきた?
Q. この二つの評価で, どの程度の情報が拾えている?
理論を見ることで, より正確に理解できる問い
第1主成分
第2主成分
w1 =
0
B
B
@
0.4733
0.6156
0.5387
0.3270
1
C
C
A
w2 =
0
B
B
@
0.5579
0.5566
0.4194
0.4506
1
C
C
A
総合評価
子育て環境
-2
-1.5
-1
-0.5
0
0.5
1
1.5
2
5 7 9 10 12
都市1 都市2 都市3 都市4 都市5
都市6 都市7 都市8 都市9 都市10
都市10
都市9
都市2
都市5
都市7
都市8
都市1
都市3
都市4
都市6
第1主成分
第
2
主
成
分
w1 =
0
B
B
@
0.4733
0.6156
0.5387
0.3270
1
C
C
A
w1 =
0
B
B
@
0.4733
0.6156
0.5387
0.3270
1
C
C
A
生活の利便性
安心・安全
医療・介護
教育
講座を通して考える問題
都市の比較分析
evw1
(xi)
evw2
(xi)
5分休憩/質問コーナー
後半の内容: 数学パート
• 次回以降に用いる線形代数の概念を説明します.
• 特に, 前半で話した, 標本分散共分散行列と分散の関係を説明します.
• 次回までに, わからない部分の洗い出しや学習をお願いします.
行列の積
2つの行列に対して, その「積」が定義できる場合があります.
(l m行列) (m n行列)=(l n行列)
0
B
@
a11 · · · a1m
.
.
.
...
.
.
.
a`1 · · · a`m
1
C
A
0
B
@
b11 · · · b1n
.
.
.
...
.
.
.
bm1 · · · bmn
1
C
A =
0
B
@
c11 · · · c1n
.
.
.
...
.
.
.
c`1 · · · c`n
1
C
A
cij =
m
X
k=1
aikbkj = ai1b1j + ai2b2j + · · · + aimbmj
行列の積
日常的な行列の積の具体例
飲料 おにぎり お菓子 新聞 雑誌
1人目の客 1 2 0 1 0
2人目の客 0 4 2 0 0
3人目の客 1 0 0 1 2
出典: 応用が見える線形代数(p.1)
金額ベクトル
0
@
1 2 0 1 0
0 4 2 0 0
1 0 0 1 2
1
A
0
B
B
B
B
@
100
120
90
110
350
1
C
C
C
C
A
飲料
おにぎり
お菓子
新聞
雑誌
0
@
1 2 0 1 0
0 4 2 0 0
1 0 0 1 2
1
A
0
B
B
B
B
@
100
120
90
110
350
1
C
C
C
C
A
=
0
@
450
660
910
1
A
支払額ベクトル
1人目の客の支払額
2人目の客の支払額
3人目の客の支払額
購買情報行列
行列の積
この講座でよく使う行列の積の具体例
(行列) (列ベクトル)=(列ベクトル)
(行ベクトル) (列ベクトル)=(内積)
✓
a b
c d
◆ ✓
x
y
◆
=
✓
ax + by
cx + dy
◆
y1 y2 · · · yn
0
B
B
B
@
x1
x2
.
.
.
xn
1
C
C
C
A
=
n
X
k=1
xkyk = x1y1 + x2y2 + · · · + xnyn
y =
0
B
B
B
@
y1
y2
.
.
.
yn
1
C
C
C
A
x =
0
B
B
B
@
x1
x2
.
.
.
xn
1
C
C
C
A
, y · x = t
yx
と表す.
tは転置(後述)
行列と変換
f : X ! Y
✓
a b
c d
◆
✓
a b
c d
◆ ✓
x
y
◆
=
✓
ax + by
cx + dy
◆
2 2行列の行列のベクトルへの積
0 0
は, 平面から平面への変換と見做せる(右図).
例. 回転 拡大/縮小
θ
0
0 0
✓
cos ✓ sin ✓
sin ✓ cos ✓
◆ ✓
3 0
0 2
◆
対角行列
回転行列
内積とノルム
(行ベクトル) (列ベクトル)=(内積)
y1 y2 · · · yn
0
B
B
B
@
x1
x2
.
.
.
xn
1
C
C
C
A
=
n
X
k=1
xkyk = x1y1 + x2y2 + · · · + xnyn
y =
0
B
B
B
@
y1
y2
.
.
.
yn
1
C
C
C
A
x =
0
B
B
B
@
x1
x2
.
.
.
xn
1
C
C
C
A
, y · x = t
yx
と表す.
ノルム
0
n=2のとき, 高校で習うベクトルの内積と一致(右図).
θ
2つのベクトル
kxk =
p
x · x
x, y に対して,
y · x = kxkkyk cos ✓ が成り立つ.
転置と内積, 対称行列
A
A
定義(転置)
ベクトルの転置と内積 対称行列
A =
0
B
@
a11 · · · a1n
.
.
.
...
.
.
.
am1 · · · amn
1
C
A の転置
t
A =
0
B
@
a11 · · · an1
.
.
.
...
.
.
.
a1m · · · amn
1
C
A
m n行列 n m行列
y =
0
B
B
B
@
y1
y2
.
.
.
yn
1
C
C
C
A
A =
0
B
@
a11 · · · a1n
.
.
.
...
.
.
.
am1 · · · amn
t
A =
0
B
@
a11 · · ·
.
.
.
...
a1m · · ·
y · x = t
yx y1 y2 · · · yn
0
B
B
B
@
x1
x2
.
.
.
xn
1
C
C
C
A
=
n
X
k=1
xkyk = x1y1 + x2y2 + · · · + xnyn
A =
0
B
@
a11 · · · a1n
.
.
.
...
.
.
.
am1 · · · amn
1
C
A
y · x = t
yx 対称行列 対称行列ではない
✓
cos ✓ sin ✓
sin ✓ cos ✓
◆
✓
3 0
0 2
◆
線形代数のコツ
1. 2変数の場合や問題が簡単になるような,
「おもちゃの例」で十分に遊ぶ.
2. 1の「おもちゃの例」で遊んで得た感覚を,
実際の問題にアナロジーとして適用.
「おもちゃの例」の経験,
アナロジーを適用するのに適切な言葉
が重要!
分散
nこのデータ(実数) に対して, その分散が,
で定まる.
例.
y1 y2 · · · yn
0
B
B
B
@
x1
x2
.
.
.
xn
1
C
C
C
A
=
n
X
k=1
xkyk = x1y1 + x2y2 +
, , ,
分散 平均
1
n
n
X
i=1
(yi y)2
, y =
1
n
n
X
i=1
yi
w1 = w2 = w3 = w4 = 0.5 のとき,
について考えると,
yi = evw(xi) (i = 1, . . . , 10)
y1 = 8.65, y2 = 8.90, y3 = 8.65, y4 = 10.40, y5 = 9.05
y6 = 11.55, y7 = 9.35, y8 = 9.25, y9 = 8.60, y10 7.05
y = 9.145
1.265725
(yの分散)=
y1 = 8.65, y2 = 8.90, y3 = 8.65, y4 = 10.40, y5 = 9.05
y6 = 11.55, y7 = 9.35, y8 = 9.25, y9 = 8.60, y10 7.05
標本分散共分散行列
で定義される行列.
n個のm次元ベクトル
に対して, その標本分散共分散行列とは,
例.
x1 =
0
B
@
x11
.
.
.
x1m
1
C
A , · · · , xn =
0
B
@
xn1
.
.
.
xnm
1
C
A
S =
0
B
@
s11 · · · s1m
.
.
.
...
.
.
.
sm1 · · · smm
1
C
A , skj =
1
n
n
X
i=1
(xij xj)(xik xk), xj =
1
n
n
X
i=1
xij
S =
0
B
@
s11 · · · s1m
.
.
.
...
.
.
.
sm1 · · · smm
1
C
A , skj =
1
n
n
X
i=1
(xij xj)(xik xk), xj =
1
n
n
X
i=1
xij
都市項目 生活の利便性 安心・安全 医療・介護 教育
都市1 6.0 2.7 2.1 6.5
都市2
6.7 2.2 2.5 6.4
都市3 5.9 3.0 1.9 6.5
都市4 6.6 5.0 2.4 6.8
都市5 7.0 2.6 2.5 6.0
都市6 8.1 4.2 4.5 6.3
都市7 7.2 2.8 2.5 6.2
都市8
7.0 3.1 2.5 5.9
都市9 7.2 2.5 2.1 5.4
都市10 5.6 2.2 1.8 4.5
右図のデータから得られるSは
S =
0
B
B
@
0.4981 0.2121 0.4146 0.0995
0.2121 0.7261 0.3086 0.2925
0.4146 0.3086 0.5176 0.1320
0.0995 0.2925 0.1320 0.4025
1
C
C
A
分散と標本分散共分散行列との関係
重みベクトル
n個のm次元ベクトル x1 =
0
B
@
x11
.
.
.
x1m
1
C
A , · · · , xn =
0
B
@
xn1
.
.
.
xnm
1
C
A と w =
0
B
@
w1
.
.
.
wm
1
C
A
に対して, 評価値 の分散は,
evw(xi) = t
wxi = w1xi1 + · · · + wmxim
S =
0
B
@
s11 · · · s1m
.
.
.
...
.
.
.
sm1 · · · smm
1
C
A , skj =
1
n
n
X
i=1
(xij xj)(xik xk), xj =
1
n
n
X
i=1
標本分散共分散行列
を用いて,
で与えられる.
t
wSw =
m
X
j=1
m
X
k=1
wjwksjk
証明は, テキストの 6.3
次回予告と次回までにしてほしいこと
次回予告
次回までにしてほしいこと
ガッツリプラン さっくりプラン
テキストを4章くらいまで読む.
2回目を受ける前に, 動画を見直す.
2回目を受ける前に,
スライドを見直す.
対称行列の固有値と主成分分析
(行列に対する固有値問題と, 主成分分析の関係を解説.)
+ 6.1~6.3
ご清聴ありがとうございました.
ではまた次回!
A x

第7回スキル養成講座講義スライド