νλμ μ΄λ―Έμ§μμ κ°μ²΄λ₯Ό μ°Ύμλ΄κ³ ,
κ·Έκ² μ΄λ€ ν΄λμ€μΈμ§ λΆλ₯νκ³ ,
κ·Έ κ°μ²΄μ μ νν μ€κ³½(ν½μ λ¨μ)μ λ§μ€ν¬λ‘ μΆμΆνλ
λ€κΈ°λ₯ λ₯λ¬λ λͺ¨λΈ
μ½κ² μ€λͺ νλ©΄
ν μ₯μ μ΄λ―Έμ§μμ:
π¦ μ¬κ³Όμ μμΉ (λ°μ€ μ’ν)
π·οΈ λ±κΈ (A/B/C)
π μ νν λͺ¨μ (λ§μ€ν¬)
π μ λ’°λ (μΌλ§λ νμ νλμ§)
β λ₯Ό λͺ¨λ ν λ²μ μΆμΆν©λλ€!
[RGB μ΄λ―Έμ§ μ
λ ₯]
β
1. Backbone (ResNet) β μ΄λ―Έμ§μμ νΉμ§ μΆμΆ
β
2. FPN (Feature Pyramid) β λ€μν ν¬κΈ° κ°μ²΄ μΈμ κ°λ₯
β
3. RPN (Region Proposal) β μ¬κ³Ό ν보 μμΉ(ROI) μ μ
β
4. ROI Align β ROIλ₯Ό κ³ μ ν¬κΈ°λ‘ μ λ ¬
β
5. Classifier Head β ROIμ ν΄λμ€(A/B/C λ±κΈ λ±) λΆλ₯
6. BBox Regressor β ROI μμΉ λ³΄μ
7. Mask Head β ν½μ
λ¨μ λ§μ€ν¬ μΆμΆ
β
[μΆλ ₯: λ±κΈ + λ°μ€ μ’ν + λ§μ€ν¬ + μ λ’°λ]
λ§νΈμμ μ¬κ³Ό μ¬μ§ ν μ₯μ μ°λλ€κ³ μκ°νμΈμ.
μ΄ μ¬μ§μλ μ¬λ¬ μ¬κ³Όκ° μμ μλ μμ΄μ.