★ AI Data 교육 사이트 - http://aidata.elancer.co.kr/student/main.php
[이전에 들은 교육 후기]
- 인공지능 윤리와 법(필수) : https://lbsdatastat.tistory.com/194
- 음성/텍스트(입문) : https://lbsdatastat.tistory.com/199
- 이미지/영상(입문) : https://lbsdatastat.tistory.com/201
- 음성(기본) : https://lbsdatastat.tistory.com/231
- 텍스트(기본) : https://lbsdatastat.tistory.com/240
- 이미지/영상(기본) : https://lbsdatastat.tistory.com/222
'2022년 인공지능 학습용 데이터 라벨링 전문 교육'에는 라벨러 과정 뿐만 아니라 데이터 전문가 과정도 같이 제공되고 있습니다. 그 중에서도 특화 과정, 전문가 과정, 관리자 과정으로 나누어 8가지의 강의를 제공하고 있는데요, 저는 그 중에서 데이터 기획 강의를 수강하게 되었습니다.
데이터 기획 과정은 약 200분 분량의 강의 6개를 수강하시고, 실습 과제에서 80점이 넘는 점수를 얻어야 수료 인정을 받으실 수 있습니다. 물론 수료증 발급을 위해서는 '인공지능 윤리와 법'이라는 필수 과정을 반드시 이수해주셔야 합니다.
강의는 기획 작성 방안, 유형 및 도메인별 구축 사례, 기획 수행 방법, 기획 절차, 기획 시 고려사항, 기획 후 활용방안 순서로 되어 있습니다. 이전 라벨러 과정들과는 다르게 교안은 제공되지 않으나, 약 50페이지 분량의 교재에서 동일한 내용을 다루고 있기 때문에 수강에는 문제가 없었습니다.
인공지능 학습용 데이터 기획을 위해 RFP를 작성해야 한다는 내용이 중점적으로 들어가 있었습니다. RFP는 Request For Proposal의 약자로 제안요청서라고 부르며, 특정 과제의 수행에 필요한 요구사항을 체계적으로 정리하여 제시함으로서 제안서를 작성하는데 도움을 주기 위한 문서라고 되어 있습니다. 추후 사용자의 제안대로 잘 실행되고 있는지 판단하기 쉽게 만들어주며, RFP가 구체적일수록 제안서의 품질이 높아지고, 프로젝트 동안 의견 충돌이나 갈등을 방지할 수 있다는 장점이 제시되었습니다.
그리고 비전 학습용, 컴퓨터 그래픽스 학습용, 음성 학습용, 한국어 학습용, 로보틱스 학습용 등 다양한 데이터 구축 사례가 소개되었고, 유형 및 도메인 선정부터 과제 발굴을 거쳐 RFP 작성까지 데이터 기획 수행 방법 또한 안내되었습니다. '데이터를 기반으로 모델을 생성하고 최종 서비스를 제공'하는 인공지능 서비스의 목적에 맞게, 인공지능 학습용 데이터를 기획하는 것에 대한 절차와 중요성이 강조되었습니다.
이후에는 데이터 획득/수집, 데이터 정제, 데이터 라벨링 과정을 포괄하는 데이터 구축 공정에 대한 고려사항을 배우게 되었습니다. 인공지능은 학습한 대로 결과값을 출력하기 때문에, "정확한 라벨링"이 필수이며, 모델의 성능에도 크게 영향을 미친다는 것을 다시 한 번 들을 수 있었습니다. 라벨러 기본 과정을 거치면서 디테일하고 섬세하지 않은 작업이 데이터 구축에 큰 영향을 미친다는 것을 확인했기 때문에, 좋은 품질의 데이터를 위해 꼼꼼한 공정 작업이 반드시 필요하다는 것은 이 이상 강조해도 부족함이 없다고 느끼게 되었습니다.
그래서 이번 과정의 실습 과제는, 데이터 제안요청서(RFP)를 직접 작성해보는 것이었습니다. 교재에 RFP에 대한 직접적인 예시가 포함되지는 않았으나, '아이디어도 좋지만, RFP를 얼마나 잘 지켰느냐가 더 중요한 채점 기준'이었기 때문에, 좋은 아이디어를 짜내기 위해 노력하기보다는 형식에 맞춰서 문서를 작성하는 것이 중점이 되었습니다. 그리고 RFP를 위한 데이터는 AI 허브에서 아이디어를 얻을 수 있었습니다.
AI 통합 플랫폼으로도 부르는 AI 허브는 위 사진과 같이 한국어, 영상이미지, 헬스케어, 재난안전환경, 교통물류 등 다양한 인공지능 학습용 데이터를 제공하고 있습니다. 2022년 9월 14일 기준으로 총 384건의 데이터셋을 제공하기 때문에, 기획을 하기 원하는 데이터셋을 확인하여 해당 내용을 토대로 RFP를 작성해도 과제 실습을 인정받을 수 있습니다.
저같은 경우에는 요즘 신용평가모델 리서치, 마이데이터 국민참여단 등 금융 관련 데이터에 대한 활동이 많아서 "금융업 특화 문서 OCR" 데이터셋을 참고하여 RFP를 작성했습니다. 해당 데이터는 금융 교객이 작성한 양식 또는 스캔된 문서에서 텍스트 및 손글씨를 검출할 수 있도록 하는 데이터로, 영상/이미지 데이터를 폴리곤이나 바운딩 박스로 라벨링한 데이터로 구성되어 있습니다. 이와 같이 데이터 개요, 메타데이터 구조표, 데이터 통계, 교육활용 동영상 등 주어진 정보를 활용하여 RFP를 작성하였고, 제출한 결과물에 대한 점수를 얻을 수 있었습니다.
참고로 실습 과제의 경우, 제출 기간은 교육 수강 종료일 + 2주 까지입니다. 즉, 8월 29일부터 9월 8일까지가 교육 수강일이라 하면 과제 제출은 9월 22일까지 제출해도 된다는 것을 의미합니다. 그래서 저도 이번에는 수강 종료일 이후인 9월 10일에 과제를 제출하게 되었고, 추석 연휴 이후인 9월 13일에 과제 채점 결과를 얻을 수 있습니다. 실습과제 제출기간의 경우 라벨러 과정도 이와 동일하게 적용되기 때문에, 기간적인 여유가 없으신 분들은 약 열흘동안의 교육 수강일 동안 출석인정을 먼저 받으시고 이후에 실습 과제 채점을 받으셔도 수료가 된다는 점 참고하시면 되겠습니다.
이를 통해, 약 3개월 동안 7개의 과정을 이수하고 6개의 수료증을 받게 되었습니다. 여러 과정과 병행해서 진행했기 때문에, 강의 분량에 비해 기간이 오래 걸렸다고도 생각합니다. 게다가 오프라인이나 실시간 온라인(Zoom)으로는 하루만에 끝낼 수 있는 교육을 하루에 몰아서 혹은 이틀에 나누어서 듣고 과정마다 후기도 기록하는 등 강의 하나마다 2~4일씩은 써서 과정 하나를 마무리할 수 있었습니다.
그럼에도 불구하고 과정을 수강하고, 실습하고, 기록하면서 데이터를 꼼꼼하게 다루는 것이 얼마나 중요한지를 적은 기간 안에 무료로 배울 수 있다는 면에서 참 유익한 과정이었다고 생각하고 있습니다. 코딩과 관련이 있는 과정은 아니지만, 데이터를 직접 다루는 분야에서 일하시는 분들이나 데이터 직무에 관심이 있으신 분들께서는 필요한 과정을 선택해서 수강하시는 것을 추천드리는 바입니다.
온라인 이러닝, 온라인 실시간, 그리고 오프라인까지 참여할 수 있는 방법은 다양하게 존재하므로 원하시는 방법대로 교육 신청을 진행하시면 되겠습니다.
★ AI Data 교육 신청 사이트 - http://aidata.elancer.co.kr/student/edulist.php
'데이터 [Data] > 라벨링 (Labeling)' 카테고리의 다른 글
라벨링교육 텍스트(기본) 수강 후기 [2022년 인공지능 학습용 데이터 라벨링 전문 교육] (0) | 2022.09.09 |
---|---|
라벨링교육 음성(기본) 수강 후기 [2022년 인공지능 학습용 데이터 라벨링 전문 교육] (0) | 2022.08.23 |
라벨링교육 이미지/영상(기본) 수강 후기 [2022년 인공지능 학습용 데이터 라벨링 전문 교육] (0) | 2022.08.12 |
라벨링교육 이미지/영상(입문) 수강 후기 [2022년 인공지능 학습용 데이터 라벨링 전문 교육] (0) | 2022.07.15 |
라벨링교육 음성/텍스트(입문) 수강 후기 [2022년 인공지능 학습용 데이터 라벨링 전문 교육] (0) | 2022.07.13 |
댓글