인공지능&데이터(교재) : [활동1] 수화를 해설하는 인공지능 만들기

생성형 인공지능 윤리 1 > Chapter 6. 보다 더 많은 사람을 위한 인공지능

[활동1] 수화를 해설하는 인공지능 만들기

수화를 해설하는 인공지능 만들기

??1_1.png

엔트리로 수화 알파벳을 해설하는 인공지능을 만들어 봅시다. 위의 동작은 수화 알파벳 각각 O, K, N의 모양입니다. ‘OK’와 ‘NO’와 같은 단어를 만들 수 있겠지요?

[관련 자료]
- (웹사이트) 엔트리 https://playentry.org/
- (6차시 활동 공유창) https://quizn.show/pbd/info/board/659798 (PIN: 659798)
- (엔트리 학생용 코드) https://naver.me/5XTcZHU4

[수업 지도 TIP]
1) 수화 알파벳 이미지 분류를 위한 인공지능을 학습시킬 때 처음에는 일부 데이터세트의 양이 부족하거나 다양 하지 못한 상태로 인공지능을 학습시켜보고 분류의 정확도가 떨어지는 문제점을 발견해본다. 이후 다시 데이터 세트를 개선해본다.
2) 이어서 관련 사례로 AI 경찰 조서가 도입되었으나 데이터 부족으로 사투리 인식률이 떨어지고 그 결과 현장에서 잘 활용되지 못하고 있는 사례를 보고 이야기를 나누어 본다.

1. 학생용 준비코드 URL을 클릭한 후 [리메이크 하기]를 누릅니다.

??1_2.png

2. 기본 코드를 살펴봅시다. 기본 코드에는 ‘수화번역’이라는 [변수]가 만들어져 있습니다.

처음에는 ’수화번역‘이라는 변수가 비어 있도록 정해놓겠습니다.

다음은 “안녕하세요”, “수화번역기입니다. 저를 클릭하고 수화를 보여주세요” 라는 인사말을 합니다.

이어서 계속 반복하기 블록 안의 명령을 봅시다. [오브젝트]를 클릭하면 비디오가 학습한 모델로 분류를 시작합니다. 분류 뒤에는 ’수화번역‘이라는 [변수]에 알파벳이 한 글자씩 더해지게 될 것입니다. 이 과정이 너무 빨리 일어나면 알파벳이 한 번에 너무 많이 인식되므로 [1초 기다리기] 블록이 들어가 있습니다.

??1_3.png

3. 우리는 수화 이미지를 분류하도록 하고자 합니다.

따라서 [인공지능]-[인공지능 모델 학습하기]-[분류:이미지]를 누릅니다.

??1_4.png

4. 새로운 모델의 이름은 ‘수화번역기’로 합니다. 3가지 수화 알파벳 ‘O, K, N’을 분류하도록 클래스도 ‘O, K, N’ 3가지로 만듭니다.

[참고] 클래스는 데이터에 붙여진 이름표, 라벨 또는 레이블(Label)입니다. 우리가 촬영한 이미지가 ‘O, K, N’ 중에 어디에 속하는지 데이터에 이름표를 붙여 놓는 것입니다.

??1_5.png

5. 알파벳 K의 이미지를 촬영할 때는 손의 크기를 다양하게 합니다. 크게, 작게, 중간 크기로 찍은 모습 각각 30여장으로 합니다. 총 이미지의 양이 140장이 되도록 합니다.

??1_6.png

6. 알파벳 O의 이미지를 촬영할 때는 손의 크기를 다양하게 합니다. 크게 찍은 모습 1~2장, 중간 크기의 모습 1~2장, 작게 찍은 모습 1~2장으로 합니다.

총 이미지의 양이 5장이 되도록 합니다.

??1_7.png

7. 알파벳 N의 이미지를 촬영할 때는 손의 크기를 작게 찍은 모습 한 종류만 촬영합니다.

총 이미지의 양이 140장이 되도록 합니다.

??1_8.png

8. 우리가 만든 데이터세트의 문제점은 무엇일까요?

이 문제를 해결하려면 데이터세트를 어떻게 개선해야 할지 이야기 나누어 보고 필요한 추가 이미지를 촬영해 봅시다.

??1_9.png

9. 떠올린 방법을 생각하며 수화 데이터세트를 개선해봅시다.

(예) O는 데이터 세트의 이미지 양이 140장 이상이 되도록 추가 촬영을 합니다. N은 데이터세트의 손의 크기가 다양하도록 추가 촬영을 합니다. 등

데이터세트를 추가로 촬영하고 개선된 결과를 확인해봅시다.

??1_10.png

Q. 나(우리 모둠)의 데이터 세트 개선 방법은?

??1_11.png

우리가 활동하며 알게 되었듯이 데이터 세트가 부족하거나 문제가 있다면 인공지능의 성능, 판단 결과에도 부정적인 영향을 줍니다. 영상에서는 AI 조서가 소개됩니다. AI 조서는 수사관이 피해자의 진술을 받아적는 부담을 덜어주고, 피해자가 더 편하게 진술을 할 수 있도록 대화 내용을 기록해 줍니다.

그러나 AI 조서가 학습한 데이터 중 사투리 데이터가 부족하여 성능이 좋지 못하고 그로 인해 사투리를 사용하는 지역에서 AI 조서가 제대로 활용되지 못하고 있습니다. 공공성을 높이기 위해 개발된 훌륭한 인공지능이 제대로 활용되지 못하고 있는 것입니다. 이러한 예상하지 못한 문제가 생겼을 때는 인공지능을 다시 개선하기 위해 노력해야 합니다.

[관련 자료]
- (영상) AI 기술 야심차게 준비했지만‥”사투리는 아직“
https://www.youtube.com/watch?v=5ERdj7B-S5c (2:23)

목록으로 돌아가기 다음 학습하기