일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- RNN
- recursion
- 알고리즘
- C언어
- 파이썬
- 주식분석
- effective python
- 텐서플로
- 하둡2
- collections
- Sort
- graph
- scrapy
- hive
- 코딩더매트릭스
- NumPy
- hadoop2
- 선형대수
- 그래프이론
- HelloWorld
- 딥러닝
- LSTM
- C
- Java
- yarn
- codingthematrix
- tensorflow
- 하이브
- python
- GRU
- Today
- Total
EXCELSIOR
[코딩더매트릭스]Chap03 - 벡터 Vector 본문
벡터란 단어는 "vehere(운반하다)"라는 뜻의 라틴어에서 유래되었다. 어떤 것을 한 장소에서 다른 곳으로 이동하는 벡터의 방향성을 내포하고 있다. 한 벡터의 모든 원소는 하나의 필드 (Chap02 참고)에서 나와야 한다.
Definition 1 : 필드 와 양의 정수 에 대해, 에 속하는 개의 원소를 가지는 벡터를 상의 -벡터라고 한다. 상의 -벡터들의 집합은 으로 나타낸다. <br />예를 들어, 아래의 (실수) 상의 4-벡터들의 집합을 라고 쓴다.
위의 4-벡터 집합을 함수로 생각하면 를 함수의 집합에 대한 표기법으로 해석할 수 있다. 따라서, 위의 4-벡터는 사실상 함수라고 할 수 있다.
3.2 벡터는 함수이다.
위의 예제를 통해 알 수 있듯이 벡터는 함수로 나타낼 수 있다.
Definition 2 : 유한 집합 와 필드 에 대해, 상의 -벡터는 에서 로의 함수이다.
3.2.1 파이썬의 딕셔너리를 이용한 벡터 표현
파이썬의 딕셔너리(Dictionary) 타입은 정의역(Domain) 치역(Image)의 형태로 벡터를 표현하는 데 유용하다. 위의 예제를 딕셔너리를 이용하면 아래와 같이 쓸 수 있다.
{0: 3.14, 1: 2.17, 2: -1.0, 3: 2.0}
3.2.2 Sparsity
대부분의 원소값이 인 벡터를 Sparse vector(희소 벡터)라고 한다. 이 아닌 언소의 수가 개인 벡터는 -sparse 라고 한다. -sparse 벡터는 에 비례하는 공간을 사용하여 표현할 수 있다. 예를 들어 여러 문서로 구성된 단어들의 모음을 을 벡터로 나타내려고 하면 필요한 공간은 모든 문서를 구성하는 총 단어의 수에 비례한다.
3.3 벡터로 무엇을 표현할 수 있는가?
다양한 데이터들에 대해 벡터로 나타낼 수 있다.
이진 문자열(binary string) : -비트 이진 문자열
10111011
을 상의 -벡터,[1, 0, 1, 1, 1, 0, 1, 1]
로 표현할 수 있다.속성(attribute) : 예를 들어, 소비자에 관한 데이터를 딕셔너리 형태의 벡터로 표현할 수 있다. 이러한 벡터를 이용하여 머신러닝 모델에 적용할 수 있다.
Jane = {'age': 30, 'education_level': 16, 'income': 85000}
확률분포 : 아래와 같이 유한한 확률 분포는 벡터로 나타낼 수 있다.
{1: 1/6, 2: 1/6, 3: 1/6, 4: 1/6, 5: 1/6, 6: 1/6}이미지 : 예를 들어,
1024 x 768
크기의 흑백 이미지는 집합 에서 실수 로의 함수로 볼 수 있고, 벡터로 불 수 있다.공간상의 점: 벡터를 이용하여 2차원 뿐만아니라 3차원 이상의 다차원의 공간의 점을 나타낼 수 있다.
# 2차원 공간상의 점
import numpy as np
import plotly.offline as offline
import plotly.graph_objs as go
# jupyter notebook 에서 출력
offline.init_notebook_mode(connected=True)
L = np.array([[2,2],[3,2],[1.75,1],[2,1],[2.25,1],[2.5,1],[2.75,1],[3,1],[3.25,1]])
x = L[:, 0]
y = L[:, 1]
def plot(x, y):
'''plotly를 이용해 plotting 함수 구현'''
trace = go.Scatter(
x = x,
y = y,
mode = 'markers')
layout = go.Layout(
showlegend=False,
xaxis=dict(
rangemode='tozero',
autorange=False
),
yaxis=dict(
rangemode='tozero',
autorange=True
)
)
data = [trace]
fig = go.Figure(data=data, layout=layout)
return offline.iplot(fig)
plot(x, y)
# 3차원 공간상의 점
x, y, z = np.random.multivariate_normal(np.array([0,0,0]), np.eye(3), 10).transpose()
trace1 = go.Scatter3d(
x=x,
y=y,
z=z,
mode='markers',
marker=dict(
size=12,
line=dict(
color='rgba(217, 217, 217, 0.14)',
width=0.5
),
opacity=0.8
)
)
x2, y2, z2 = np.random.multivariate_normal(np.array([0,0,0]), np.eye(3), 10).transpose()
trace2 = go.Scatter3d(
x=x2,
y=y2,
z=z2,
mode='markers',
marker=dict(
color='rgb(127, 127, 127)',
size=12,
symbol='circle',
line=dict(
color='rgb(204, 204, 204)',
width=1
),
opacity=0.9
)
)
data = [trace1, trace2]
layout = go.Layout(
margin=dict(
l=0,
r=0,
b=0,
t=0
)
)
fig = go.Figure(data=data, layout=layout)
offline.iplot(fig)
3.4 벡터 덧셈
3.4.1 평행이동과 벡터 덧셈
벡터의 평행이동은 벡터()에 더하는 함수 에 의해 평행이동을 할 수 있다.
Definition 3 : -벡터들의 덧셈은 대응하는 원소들의 덧셈으로 정의된다.
모든 필드 ( 등)는 을 원소로 가진다. 그렇기 때문에 상의 -벡터들로 구성된 집합 는 반드시 영벡터를 가진다. 영벡터는 모든 원소의 값이 인 벡터를 말하며 으로 표기한다. <br />따라서, 함수 에 의한 평행이동은 그 결과가 입력과 동일한 평행이동이다.
Task 3.4.3
[1, 2]를 아래의 리스트 L
의 각각의 벡터에 더하여 얻어진 점들을 그래프로 그려보자.
# Task 3.4.3
L = [[2,2],[3,2],[1.75,1],[2,1],[2.25,1],[2.5,1],[2.75,1],[3,1],[3.25,1]]
L = np.array(L)
L_add = L + [1, 2]
x = L_add[:, 0]
y = L_add[:, 1]
# plot(x, y)
3.4.2 벡터 덧셈의 결합성과 교환성
필드(체)에서 덧셈의 두 가지 성질은 결합성(associativity)과 교환성(commutativity)이다.
Proposition : 임의의 벡터 에 대해 다음의 성질이 성립한다.
3.4.3 벡터를 화살표로 표현하기
필드상의 -벡터들은 의 화살표로 나타낼 수 있다. 예를 들어, -벡터 는 꼬리가 원점에 있고 화살표가 에 있는 화살표로 나타낼 수 있다.
%matplotlib inline
import matplotlib.pyplot as plt
ax = plt.axes()
ax.arrow(0, 0, 3.0, 1.5, head_width=0.1, head_length=0.1)
plt.ylim([0, 10])
plt.xlim([0, 10])
또한 상의 벡터들의 덧셈을 화살표를 사용하여 보여줄 수 있다.
3.5 스칼라 - 벡터 곱셈
Chap02-필드에서 스케일링(Scaling)은 복소평면에서 입력된 복소수를 양의 실수 과 곱하는 함수 로 나타낼 수 있었다. 이처럼 벡터에 대해서도 스칼라-벡터 곱(scalar-vector multiplication)에 의해 벡터를 스케일링 할 수 있다. 벡터에서 필드 원소(e.g. 숫자)는 스칼라(scalar)라 하며, 그 이유는 곱셈을 통해 벡터를 스케일링 하는데 사용할 수 있기 때문이다.
Definition 4 : 벡터 와 스칼라 의 곱셈은 의 원소 각각을 와 곱하는 것으로 정의된다.
Task 3.5.4
L
내의 벡터들을 만큼 스케일링한 결과와 만큼 스케일링한 결과를 그래프로 그려보자.
L = [[2,2],[3,2],[1.75,1],[2,1],[2.25,1],[2.5,1],[2.75,1],[3,1],[3.25,1]]
L = np.array(L)
L1 = L * 0.5
L2 = L * (-0.5)
trace1 = go.Scatter(x=L1[:, 0],
y=L1[:, 1],
mode = 'markers')
trace2 = go.Scatter(x=L2[:, 0],
y=L2[:, 1],
mode = 'markers')
layout = go.Layout(
showlegend=False,
xaxis=dict(
rangemode='tozero',
autorange=True
),
yaxis=dict(
rangemode='negative',
autorange=True
)
)
data = [trace1, trace2]
fig = go.Figure(data=data, layout=layout)
# offline.iplot(fig)
3.5.1 화살표 스케일링하기
상의 벡터를 양의 실수로 스케일링 하는 것은 벡터의 방향을 바꾸지 않고 화살표의 길이만 변경한다. 아래의 예제 코드는 위의 의 벡터를 2배한 화살표이다. 음의 실수를 곱하게 되면 벡터의 방향이 반대가 된다.
ax = plt.axes()
ax.arrow(0, 0, 3.0*2, 1.5*2, head_width=0.1, head_length=0.1)
plt.ylim([0, 10])
plt.xlim([0, 10])
3.5.2 스칼라-벡터 곱셈의 결합성
벡터를 스칼라와 곱한 다음에 그 결과를 또 다른 스칼라와 곱하는 것은 아래와 같이 단순화 할 수 있다.
Proposition (Associativity) :
3.5.3 원점을 지나는 선분
하나의 벡터와 스칼라 곱을 통해 스케일링하여 원점을 지나는 선분을 만들 수 있다. 아래의 예제는 벡터 를 스케일링하여 선분을 만드는 예시이다.
# [3, 2] 벡터를 10등분으로 스케일링
vecs = [[3 * (i/10), 2 * (i/10)] for i in range(11)]
vecs = np.array(vecs)
x = vecs[:, 0]
y = vecs[:, 1]
plot(x, y)
# [3, 2] 벡터를 100등분으로 스케일링
vecs = [[3 * (i/100), 2 * (i/100)] for i in range(101)]
vecs = np.array(vecs)
x = vecs[:, 0]
y = vecs[:, 1]
plot(x, y)
3.5.4 원점을 지나는 직선
위의 예제에서 선분을 확장하여 양수의 스칼라와 음수의 스칼라를 곱하여 스케일링 하게 되면 원점을 지나는 직선을 만들 수 있다.
vecs = [[3 * (i/10), 2 * (i/10)] for i in range(-10, 11)]
vecs = np.array(vecs)
x = vecs[:, 0]
y = vecs[:, 1]
plot(x, y)
vecs = [[3 * (i/100), 2 * (i/100)] for i in range(-100, 101)]
vecs = np.array(vecs)
x = vecs[:, 0]
y = vecs[:, 1]
plot(x, y)
3.6 벡터 덧셈과 스칼라 곱셈 결합하기
3.6.1 원점을 지나지 않는 선분과 직선
위의 예제에서 평행이동을 적용하게 되면 아래의 그림처럼 그래프가 그려진다.
vecs = [[3 * (i/100), 2 * (i/100)] for i in range(101)]
vecs = np.array(vecs)
vecs_trns = [[3 * (i/100) + 0.5, 2 * (i/100) + 1] for i in range(101)]
vecs_trns = np.array(vecs_trns)
trace1 = go.Scatter(x=vecs[:, 0],
y=vecs[:, 1],
mode = 'markers',
name = 'original')
trace2 = go.Scatter(x=vecs_trns[:, 0],
y=vecs_trns[:, 1],
mode = 'markers',
name = 'translation')
layout = go.Layout(
showlegend=False,
xaxis=dict(
rangemode='tozero',
autorange=True
),
yaxis=dict(
rangemode='negative',
autorange=True
),
annotations=[
dict(
x=3,
y=2,
xref='x',
yref='y',
text='Orignial',
showarrow=True,
arrowhead=7
),
dict(
x=3.5,
y=3,
xref='x',
yref='y',
text='Translation',
showarrow=True,
arrowhead=7
),
]
)
data = [trace1, trace2]
fig = go.Figure(data=data, layout=layout)
offline.iplot(fig)
3.6.2 스칼라-벡터 곱셈과 벡터 덧셈의 분배 법칙
아래의 성질은 필드에 대한 분배법칙 에서 비롯된다.
Proposition (벡터 덧셈에 대한 스칼라-벡터 곱의 분배 ):
Proposition (스칼라 덧셈에 대한 스칼라-벡터 곱의 분배 ):
3.6.3 블록결합(Convex combination) 들여다 보기
와 을 잇는 선분을 이루는 점들의 집합에 대한 표현식은 이다. 이를 다음과 같이 더 나은 식으로 표현할 수 있다.
형태의 표현식은 와 의 블록결합이라고 한다. 위의 예를 통해 임의의 상의 -벡터들의 쌍 에 대해 아래와 같이 말할 수 있다.
Proposition : - 선분은 와 의 블록결합들의 집합으로 구성된다.
Task 3.6.9
파이썬 함수, segment(pt1, pt2)
를 작성해 보자. pt1=[3.5,3], pt2=[0.5,1]
일 경우, 리턴 결과인 100개의 점을 그래프로 그려보자
def segment(pt1, pt2):
pt1 = [[pt1[0] * i/100, pt1[1] * i/100] for i in range(101)]
pt2 = [[pt2[0] * (1-(i/100)), pt2[1] * (1-(i/100))] for i in range(101)]
pt1 = np.array(pt1)
pt2 = np.array(pt2)
result = pt1 + pt2
x = result[:, 0]
y = result[:, 1]
return x, y
pt1 = [3.5, 3]
pt2 = [0.5, 1]
x, y = segment(pt1, pt2)
plot(x, y, autorange=False)
Example 3.6.10
이미지를 나타내는 벡터들의 쌍에 대한 블록결합을 고려해 보자. 이미지 예로는 설현의 이미지를 이용하였다.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 | from PIL import Image # 이미지 파일 불러오기 u = Image.open('./images/img01.jpg') u = u.convert('L') v = Image.open('./images/img02.PNG') v = v.convert('L') v = v.resize(u.size) # 이미지 사이즈를 u의 사이즈와 같게 맞추기 # 이미지 파일을 np.asarray를 이용해 배열로 만들기 u = np.asarray(u, dtype='float32') v = np.asarray(v, dtype='float32') fig, axs = plt.subplots(1, 2, figsize=(25, 5)) fig.subplots_adjust(hspace = .5, wspace=.001) img_org = [u, v] for i, img in enumerate(img_org): axs[i].imshow(img ,cmap='Greys_r') | cs |
123 # 스칼라 (1/2)을 곱하여 블록결합 하기comb = (1/2) * (u + v)plt.imshow(comb, cmap='Greys_r') cs
1 2 3 | # 스칼라 (1/2)을 곱하여 블록결합 하기 comb = (1/2) * (u + v) plt.imshow(comb, cmap='Greys_r') | cs |
1 2 3 4 5 6 | img_list = [v*(i/8) + u*(1-(i/8)) for i in range(9)] fig, axs = plt.subplots(1, 9, figsize=(20, 3)) for i, img in enumerate(img_list): axs[i].imshow(img ,cmap='Greys_r') | cs |
3.6.4 아핀결합(Affine combination) 들여다 보기
위의 3.6.3 절에서는 선분을 이루는 벡터들의 집합을 블록결합으로 표현하였다. 이번에는 과 을 지나는 (무한)직선에 대해 알아보도록 하자. 이러한 직선은 아래와 같이 집합으로 표현할 수 있다.
형태의 표현식을 와 의 아핀결합(Affine combination) 이라고 부른다.
Hypothesis : 와 를 지나는 직선은 와 의 아핀결합들의 집합으로 구성된다.
3.7 딕셔너리에 기반을 둔 벡터 표현
이 교재에서는 파이썬의 딕셔너리를 이용하여 vec.py의 파이썬 파일에 클래스Vec
이 정의 되어 있다. Vec
클래스의 인스턴스 변수는 아래와 같다.
f
: 파이썬의 딕셔너리에 의해 표현되는 함수D
: 파이썬의 집합에 의해 표현되는 함수의 정의역
아래의 방법을 이용해 Vec
의 필드(변수)에 접근할 수 있다.
from vec import Vec, setitem, getitem
v = Vec({'A', 'B', 'C'}, {'A': 1})
for d in v.D:
if d in v.f:
print(v.f[d])
3.7.1 세터(setter)와 게터(getter)
setitem
, getitem
함수를 이용해 벡터의 값을 할당하거나, 벡터의 값을 얻어올 수 있다. <br />
먼저, setitem(v, k val)
은 벡터(k
)에 값(val
)을 할당하는 함수이다.
def setitem(v,k,val):
v.f[k] = val
getitem(v, k)
은 벡터(k
)의 값을 리턴해주는 함수이다.
def getitem(v,k):
result = v.f[k] if k in v.f else 0
return result
3.7.2 스칼라-벡터 곱셈
Quiz 3.7.3
scalar_mul(v, alpha)
을 작성해 보자.
input
:Vec
의 인스턴스와 스칼라alpha
output
: 스칼라-벡터 곱alpha x v
를 나타내는Vec
의 새로운 인스턴스
def scalar_mul(v, alpha):
result = {d: alpha * getitem(v, d) for d in v.D}
return Vec(v.D, result)
3.7.3 덧셈
Quiz 3.7.4
add(u, v)
를 작성해보자.
input
:Vec
의 인스턴스u
와v
output
:u
와v
의 벡터 합인Vec
의 인스턴스
def add(u, v):
result = {d: getitem(u, d) + getitem(v, d) for d in u.D}
return Vec(u.D, result)
3.7.4 음의 벡터, 벡터 덧셈의 가역성, 벡터 뺄셈
벡터 에 대한 음의 벡터는 이며 의 각 원소값의 부호를 바꾸면 된다. 벡터를 화살표로 나타내면, 는 동일한 길이를 가지며 방향이 정반대를 가리키는 화살표이다. 즉, 음의 벡터 는 역 평행이동이라 할 수 있다. <br />
벡터의 뺄샘은 음의 벡터의 덧셈으로 정의할 수 있다. 는 로 표현할 수 있다. <br />
벡터 뺄셈은 벡터 덧셈의 역이다.
Quiz 3.7.5
neg(v)
를 작성해 보자.
input
:Vec
의 인스턴스v
output
: 음의v
를 나타내는 딕셔너리
def neg(v):
result = {d: (-1) * getitem(v, d) for d in v.D}
return Vec(v.D, result)
3.8 상의 벡터
생략
3.9 도트곱(Dot product)
두 개의 -벡터들 와 에 대해, 도트곱은 대응하는 원소(엔트리)들의 곱의 합이다.
예를 들어, 벡터 , 에 대해,
위의 도트곱의 연산 결과는 벡터가 아니라 스칼라 이다. 이러한 이유 때문에 도트곱은 벡터들의 스칼라 곱(scalar product) 이라고도 한다. <br />
의 오직 한 원소, 예를 들어, 번째 원소가 이고, 나머지 다른 원소들은 이면, 는 의 번째 원소이다.
Quiz 3.9.3
위의 예제 벡터인 의 원소들의 평균을 도트곱으로 표현 해보자. 먼저, dot(u, v)
함수는 아래와 같다
def dot(u, v):
result_vec = {d: getitem(u, d) * getitem(v, d) for d in u.D}
result_dot = sum(list(result_vec.values()))
return result_dot
3.9.2 선형방정식
Definition : 선형방정식(일차 방정식)으 의 형태를 가지는 식으로, 는 벡터, 는 스칼라이며, 는 벡터 변수이다.
Example 3.9.7
센서 노드의 에너지 사용률 : 정의역를 아래와 같이 정의 해보자.
각 하드웨어 구성요소를 전력 소모에 매핑하는 함수는 벡터이며 이것을 라 하고, 각 구성요소를 테스트 기간 동안에 켜져있는 시간의 양에 매핑하는 함수 또한 벡터이며 이라 한다. 이를 코드로 나타내면 아래와 같다.
from vec import Vec
D = {'memory', 'radio', 'sensor', 'cpu'} # 정의역(Domain)
# 함수(function, vector)
f_rate = {'memory': 0.06, 'radio': 0.1, 'sensor': 0.004, 'cpu': 0.0025}
f_duration = {'memory': 1.0, 'radio': 0.2, 'sensor': 0.5, 'cpu': 1.0}
rate = Vec(D, f_rate) # rate 정의
duration = Vec(D, f_duration)
테스트 기간 동안 센서 노드에 의해 소모된 총 에너지는 (도트곱) 이다.
joule = dot(rate, duration)
print('Joule = {:.4f}'.format(joule))
## >> Joule = 0.0845
Definition : 선형방정식들의 시스템(선형시스템)은 방정식들의 컬렉션이다.
3.9.3 ~ 3.9.7 : 생략
3.9.8 도트곱의 대수적 성질
교환성(Commutativity)
두 벡터의 도트곱을 계산할 때 벡터의 순서는 상관 없다.
Proposition :
동질성(Homogeneity)
도트곱의 벡터 중 하나에 스칼라를 곱하는 것은 도트곱의 결과값에 곱하는 것과 같다.
Proposition :
분배성(Distributivity)
벡터 덧셈에 대한 도트곱의 분배법칙
Proposition :
3.10 생략
3.11 선형방정식들의 삼각시스템에 대한 해 구하기
3.11.1 상삼각시스템(Upper-triangular system)
선형방정식들의 상삼각시스템 다음 형태를 가진다.
첫 번쨰 벡터는 을 가지지 않아도 된다.
두 번째 벡터는 첫 번째 위치의 값이 이다.
세 번째 벡터는 첫 번쨰와 두 번째 위치의 값이 이다.
네 번째 벡터는 첫 번째, 두 번째, 그리고 세 번째 위치의 값이 이다.
번째 벡터는 번째와 번째 원소를 제외한 모든 원소가 이다.
번째 벡터는 번째 원소 이외에는 모두 이다.
상삼각시스템(Upper-triangular system) 이란 용어는 아래의 그림을 보면 쉽게 이해할 수 있다. 아래의 그림 처럼 이 아닌 원소들은 삼각형을 형성한다.
아래의 예제는 -벡터의 Upper-triangular system의 예이다.
라 하고 도트곱의 정의를 사용하면 아래와 같이 연립 방정식으로 나타낼 수 있다.
3.11.2 후진대입법(Backward substitution)
위의 4-벡터 예제를 다음과 같이 후진대입법으로 벡터 를 구할 수 있다.
'Linear Algebra > Coding the Matrix' 카테고리의 다른 글
[코딩더매트릭스]Chap05 - 행렬 The Matrix (2) | 2018.03.14 |
---|---|
[코딩더매트릭스]Chap04 - 벡터공간 Vector Space (0) | 2018.02.27 |
[코딩더매트릭스]Chapter02 - 필드 Field (0) | 2018.02.01 |
[코딩더매트릭스]Chapter01 - 함수(Function) (0) | 2018.01.22 |
코딩 더 매트릭스 스터디 게시판입니다. (0) | 2018.01.22 |