Digitalian

"인간과 인공지능"

학습여정/인공지능

딥러닝과 신경망의 완전한 이해

digitalian 2025. 7. 3. 17:30

“강의에서 배운 내용을 정리해 공유합니다. 실전으로 활용하시기 바랍니다.”


서론: 인공지능의 핵심, 신경망과 딥러NING에 대한 오해와 진실

  • 딥러닝과 신경망은 인공지능에서 자주 혼용되며, 머신러닝의 핵심 기술이다.
  • 그러나 이 기술은 종종 과장된 기대와 신비주의에 둘러싸여 있다.
  • 많은 사람들이 기술적 장벽과 심리적 거리감으로 인해 쉽게 접근하지 못한다.
  • 신경망은 단순한 구조물이 아니라 데이터로부터 학습하고 문제 해결 능력을 갖춘 동적인 시스템이다.

 

 

 

제1장: 신경망의 가장 기본적인 단위 - 인공 뉴런의 작동 원리

  • 신경망을 이해하려면 가장 작은 단위인 인공 뉴런부터 알아야 한다.
  • 인공 뉴런 하나는 매우 단순한 원리로 작동한다.
  • 예시로, 티셔츠의 가격에 따라 수요를 예측하는 모델을 사용한다.
  • 가격이 오르면 수요는 줄고, 일정 가격 이상부터는 수요가 0으로 수렴한다.
  • 이 관계를 나타내는 곡선(비선형)은 인공 뉴런 하나로도 계산 가능하다.
  • 인공 뉴런은 입력(가격)을 받아 출력(예상 수요)를 계산하는 작은 구조이다.
  • 뉴런은 단순 전달기가 아니라 입출력 관계를 학습하는 함수 근사기 역할을 한다.
  • 단순한 직선뿐 아니라 비선형적인 현실 관계도 모델링 가능하다.
  • 인공 뉴런 하나는 그 자체로 독립된 수학 모델이며, 이것이 신경망의 기본 벽돌이다.

 

 

제2장: 복잡성의 구축 - 레고 블록처럼 쌓아 올리는 신경망

  • 인공 뉴런 하나는 단순한 입력-출력 관계를 모델링할 수 있다.
  • 더 복잡한 문제 해결을 위해 여러 뉴런을 연결하여 신경망 구조를 만든다.
  • 신경망은 뉴런들을 층(layer)으로 구성하며, 특히 은닉층이 중요한 역할을 한다.
  • 예시로, 티셔츠 수요는 가격 외에도 배송비, 마케팅, 원단 등 여러 요인의 영향을 받는다.
  • 이 다양한 입력을 처리하기 위해 은닉층에서는 중간 개념(경제성, 인지도, 인지된 품질)을 계산한다.
  • 출력층은 이 중간 개념들을 종합해 최종 수요 예측을 수행한다.
  • 신경망은 단순한 블랙박스가 아니라, 입력을 추상화 계층으로 처리하여 복잡한 문제를 이해 가능한 구조로 재해석한다.
  • 이처럼 계층적으로 정보 처리하는 방식은 신경망이 '이해 기반의 지능'을 갖춘 시스템이 되게 만든다.
 

제3장: 신경망의 '마법' - 데이터로부터 스스로 학습하는 자동화된 특징 추출

  • 앞선 장에서는 신경망이 ‘경제성’ 등 중간 개념을 계산해 문제를 푼다고 설명했다.
  • 하지만 인간이 직접 그 개념을 프로그래밍하지는 않는다는 점이 핵심이다.
  • 신경망은 입력(A)과 출력(B)만 주어지면, 중간 과정(은닉층 계산)을 스스로 학습한다.
  • 개발자의 역할은 ‘경제성을 계산하라’고 지시하는 것이 아니라,
  (1) 데이터를 제공하고
  (2) 신경망 구조를 설계하며
  (3) 학습 알고리즘을 실행하는 것이다.
  • 이 과정에서 신경망은 스스로 필요한 중간 특징(feature)을 창발적으로 형성한다.
  • ‘경제성’, ‘인지도’ 같은 개념은 인간이 정의한 게 아니라, 신경망이 데이터를 통해 스스로 발견한 것이다.
  • 이것은 기존 프로그래밍(규칙 기반 명시) 방식에서, 데이터 기반 학습 시스템으로의 패러다임 전환이다.
  • 이제 인간은 규칙 설계자가 아니라 환경 설계자(Architect)와 데이터 교사(Teacher)의 역할을 맡는다.
  • 이 자동화된 특징 학습 능력 덕분에, 인간이 명시적으로 설명하기 어려운 복잡한 문제까지도 신경망이 해결할 수 있다.
 

제4장: 실제 세계 문제에의 적용 - 이미지 인식을 통한 계층적 특징 학습 심층 분석

  • 얼굴 인식처럼 수백만 개의 입력값을 가진 복잡한 문제도 신경망의 기본 원리로 해결 가능하다.
  • 컴퓨터는 이미지를 픽셀 값 숫자 배열로 처리하며, 컬러 이미지 1000×1000 해상도라면 약 300만 개 입력값이 필요하다.
  • 신경망은 이 수많은 입력을 받아 한 명의 신원을 출력하는 구조로 학습한다.
  • 이처럼 많은 층과 뉴런이 필요한 복잡한 신경망을 딥러닝이라 한다.
  • 딥러닝의 핵심은 층이 깊어질수록 더 복잡하고 추상적인 특징을 학습한다는 점이다.
  • 학습 계층 구조는 다음과 같다:
→ 초기 계층: 선, 곡선 같은 엣지(edge) 탐지
→ 중간 계층: 엣지를 조합해 눈, 코, 입 등 얼굴 부위 인식
→ 깊은 계층: 얼굴 부위를 조합해 전체 얼굴 형태 인식
→ 출력 계층: 최종적으로 인물의 신원 판별
  • 이 모든 특징 학습은 인간의 지시 없이 자동으로 학습된다.
  • 결국, 층이 깊을수록 추상화 수준이 높아져, 신경망은 사람처럼 고차원적 인지를 하게 된다.
  • 수요 예측과 얼굴 인식은 규모는 다르지만, “입력 A → 출력 B”라는 학습 원리는 동일하다.
 
표 1: 신경망 모델 비교 분석: 수요 예측 vs. 얼굴 인식
 
  • 입력 데이터의 형태나 문제의 종류와 상관없이, 
  • 충분한 데이터와 적절한 구조만 주어진다면 
  • 신경망은 입력과 출력 사이의 복잡한 관계를 스스로 학습하여 
  • 놀라운 성능을 발휘하는 범용 학습 기계(universal learning machine)로 작동합니다.

 

 

결론: 단순한 계산기에서 복잡한 인식 시스템으로의 진화

  • 인공 뉴런은 입력과 출력을 연결하는 작은 함수 근사기로 작동한다.
  • 여러 뉴런이 레고 블록처럼 연결되어 복잡한 신경망을 형성한다.
  • 은닉층은 ‘경제성’, ‘인지도’ 등 추상적 개념을 자율적으로 형성한다.
  • 인간이 명시적 규칙을 코딩하지 않아도, 데이터만으로 내부 로직을 신경망이 스스로 학습한다.
  • 이 학습 능력은 얼굴 인식처럼 수백만 개 입력이 필요한 문제까지도 확장 적용된다.
  • 딥러닝은 픽셀 → 엣지 → 얼굴 부위 → 전체 얼굴 → 신원으로 이어지는 계층적 특징 학습을 수행한다.
  • 핵심은 개별 계산 단위가 아닌, 단순한 뉴런들의 집단적 상호작용과 자동화된 학습 구조이다.
  • 딥러닝의 원리는 신비가 아니라, 명확한 개념적 이해로 설명 가능한 기술적 구조임이 드러났다.
  • 이것은 인공지능 시대의 이해와 활용을 위한 새로운 출발점이 된다.
  • 딥러닝은 복잡한 코딩 없이, 단순한 뉴런들이 데이터로부터 스스로 학습해 문제를 해결하는 집단적 지능 시스템이다.

 


※본 요약은 ‘공정 이용(fair use)’사용 목적으로, 모든 내용은 Stanford University 의 Coursera강의 ‘모두를 위한 AI’를 수강하며 작성한 요약이며, 직접적인 강의 내용 복사, 슬라이드 캡쳐등은 저작권에 의하여 엄격히 보호됩니다. - 앤드류 응(Andrew Ng)의 강의 by Coursera Plus - "Learning Notes and Summaries by Digitalian”