λ₯λ¬λ νμ΄ν μΉ κ΅κ³Όμ μκ°
λ₯λ¬λμ μΈκ³΅μ§λ₯ λΆμΌμ ν΅μ¬ κΈ°μ λ‘, λλμ λ°μ΄ν°λ‘λΆν° ν¨ν΄μ νμ΅νκ³ μ΄λ₯Ό κΈ°λ°μΌλ‘ μμΈ‘ λ° κ²°μ μ λ΄λ¦¬λ 볡μ‘ν λͺ¨λΈλ§ κΈ°λ²μ λλ€. κ·Έ μ€μμλ νμ΄ν μΉ(PyTorch)λ μΈκΈ°κ° λκ³ , λ§μ μ°κ΅¬μμ κ°λ°μλ€μ΄ μ νΈνλ λ₯λ¬λ νλ μμν¬μ λλ€. μ΄λ² ν¬μ€νΈμμλ "λ₯λ¬λ νμ΄ν μΉ κ΅κ³Όμ"μ λν΄ μμΈν μκ°νκ² μ΅λλ€.
μ μ λ° λ°°κ²½
"λ₯λ¬λ νμ΄ν μΉ κ΅κ³Όμ"λ νμ΄μ¬μ κΈ°λ°μΌλ‘ ν νμ΄ν μΉ νλ μμν¬λ₯Ό νμ©νμ¬ λ₯λ¬λμ κΈ°μ΄λΆν° μ¬ν μ£Όμ μ μ΄λ₯΄κΈ°κΉμ§ νλκ² λ€λ€μ§ μ± μ λλ€. μ μλ€μ κ°κ° λ₯λ¬λ λ° λ¨Έμ λ¬λ λΆμΌμμ μ€λ κ²½λ ₯μ κ°μ§κ³ μμΌλ©°, μ°κ΅¬μ μ€λ¬΄μμ μμ κ²½νμ λ°νμΌλ‘ μ΄ κ΅κ³Όμλ₯Ό μ§ννμ΅λλ€.
μ£Όμ λ΄μ© λ° κ΅¬μ±
μ΄ κ΅κ³Όμλ λ€μκ³Ό κ°μ 체κ³μ μΈ κ΅¬μ±μΌλ‘ μ΄λ£¨μ΄μ Έ μμ΅λλ€:
λ₯λ¬λ κΈ°μ΄
- μΈκ³΅μ§λ₯κ³Ό λ¨Έμ λ¬λ, λ₯λ¬λμ κ°λ μ€λͺ
- μ κ²½λ§μ κΈ°λ³Έ ꡬ쑰μ μλ μ리
νμ΄ν μΉμ κΈ°μ΄
- νμ΄ν μΉ μ€μΉ λ° κΈ°λ³Έ μ¬μ©λ²
- ν μ(tensor)μ μλ λ―ΈλΆ(autograd)μ μ΄ν΄
μ κ²½λ§ κ΅¬μ±
- νΌμ νΈλ‘ , CNN(컨볼루μ μ κ²½λ§), RNN(μν μ κ²½λ§) λ±μ λ€μν μ κ²½λ§ λͺ¨λΈ ꡬν
- κ° λͺ¨λΈμ νΉμ§κ³Ό νμ© μ¬λ‘ μ€λͺ
νλ ¨ λ° μ΅μ ν
- μμ€ ν¨μ, μ΅μ ν λ°©λ²(μ: SGD, Adam) λ± λ₯λ¬λ λͺ¨λΈμ νλ ¨ κ³Όμ
- κ³Όμ ν©(overfitting)κ³Ό μ κ·ν(regularization)μ κ°λ
λ₯λ¬λ μμ©
- μμ°μ΄ μ²λ¦¬(NLP), μ΄λ―Έμ§ μ²λ¦¬, μΆμ² μμ€ν λ± λ€μν μμ© λΆμΌ μ¬λ‘
- μ€μ΅κ³Ό μμ λ₯Ό ν΅ν μ μ© λ₯λ ₯ κ°ν
νμ΅ λͺ©ν
"λ₯λ¬λ νμ΄ν μΉ κ΅κ³Όμ"μ μ£Όμ λͺ©νλ λ μκ° μ€μ λ‘ λ₯λ¬λ λͺ¨λΈμ μ€κ³νκ³ κ΅¬ννλ λ₯λ ₯μ κ°μΆλλ‘ λλ κ²μ λλ€. μ΄ μ± μ μ΄λ‘ μ μΈ μ€λͺ λΏλ§ μλλΌ, μ€μ΅μ μΈ μμ λ₯Ό ν΅ν΄ νμ΅μκ° μ§μ μ½λλ₯Ό μμ±νκ³ κ²°κ³Όλ₯Ό νμΈν μ μλ κΈ°νλ₯Ό μ 곡ν©λλ€.
λμ λ μ
μ΄ κ΅κ³Όμλ λ₯λ¬λμ λν κΈ°μ΄ μ§μμ κ°μ§κ³ μλ μ΄λ³΄μλΆν°, μ’ λ κΉμ΄ μλ μ΄ν΄λ₯Ό μνλ μ€κΈμκΉμ§ λͺ¨λμκ² μ ν©ν©λλ€. νμ΄ν μΉμ λν μ¬μ μ§μμ΄ μλ λ μλ μ½κ² λ°λΌμ¬ μ μλλ‘ κ΅¬μ±λμ΄ μμ΄, νμ΅ λμ΄λκ° μ μ νκ² λ°°λΆλμ΄ μμ΅λλ€.
κ²°λ‘
λ₯λ¬λμ μμΌλ‘μ κΈ°μ λ°μ μ μ§λν μν₯μ λ―ΈμΉ κ²μΌλ‘ μμλλ©°, νμ΄ν μΉλ μ΄λ₯Ό μν κ°λ ₯ν λꡬμ λλ€. "λ₯λ¬λ νμ΄ν μΉ κ΅κ³Όμ"λ μ΄λ¬ν κΈ°μ μ νμ΅νκ³ μ μ©ν μ μλ νλ₯ν μ§μΉ¨μκ° λ κ²μ λλ€. λ₯λ¬λμ μΈκ³μ λ°μ λ€μ¬λκ³ μ νμλ λΆλ€κ» μ΄ μ± μ μ κ·Ή μΆμ²ν©λλ€. λ€μν μμ μ μ€μ΅μ ν΅ν΄ λ₯λ¬λμ λν μ΄ν΄λ₯Ό μ¬νμν€κ³ , μ€μ νλ‘μ νΈμμ νμ©ν΄ 보μΈμ. μ΄ κ΅κ³Όμλ₯Ό ν΅ν΄ λ₯λ¬λ λΆμΌμ μ λ¬Έκ°λ‘ μ±μ₯ν μ μλ κΈ°νλ₯Ό λμΉμ§ λ§μκΈΈ λ°λλλ€.