티스토리 뷰

여기에 좋은 질문입니다. 대답은 두 가지가되어야합니다.

W 도트 X =? = X 도트 W

X와 W를 교환하면 행렬 곱셈에 대해 다른 결과가 발생한다는 사실에 완벽하게 맞습니다.

그러나이 상황에서 w와 x는 실제로 벡터 또는 m * 1 행렬입니다. 내적은 스칼라가됩니다. 따라서이 상황에서 'x dot w'와 'w dot x'는 동일합니다.

보시다시피 x는 벡터 특성을 나타내는 [x0, x1, x2, ..., xm]으로 해석됩니다.

이 함수가하는 것은 뉴런의 입력과 가중치를 결합하는 것 w입니다. 이러한 입력은 이전 계층의 뉴런에서 나온 출력입니다. 뉴런의 출력이 스칼라라는 것을 알고 있습니다.

편향 항 W_ [0] 정보

실제로 구현 w_ [0]이 다항식 끝에 추가된다는 점에서 다릅니다. 이는 입력의 선형 조합 결과를 수정하는 바이어스 항 또는 x. 이 편향 용어를 사용하는 것이 구현에서 일반적인 관행입니다. 그러나 수학에서는 조합의 선형 특성을 변경하지 않으므로 일반적으로 생략합니다. 물론 어떤 상황에서는이 편향 용어가 수학 표현에 명시 적으로 나열됩니다.

====== 업데이트 =======

질문이 업데이트됨에 따라 실제 상황에 대한 추가 설명이 추가됩니다.

이 경우 첫 번째 차원은 결과에 대한 ' broadcast '입니다.

더 간단한 상황을 고려하십시오.

w[1:]:  [-0.68  1.82]

X: [ 3.3   0.  ]

@Peater와 내가 설명했듯이 X와 w는 모두 벡터입니다.

실제 설정에서 X는 행렬이 아니라 샘플링 또는 시간에 따라 변하는 vactor 변수입니다. X의 차원이 [n * 2]라고 가정하면 x는 n 개의 샘플을 포함하는 2 차원 벡터입니다.

여기서 샘플은 다른 시간 프레임 또는 다른 픽셀에서 변수에 대한 다른 평가를 의미합니다. X의이 차원은 결과에 브로드 캐스트됩니다.



출처
https://stackoverflow.com/questions/39930035
댓글
공지사항
Total
Today
Yesterday
«   2025/08   »
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31