Goodbye 2020, Welcome 2021

Goodbye 2020, Welcome 2021
캐글코리아 4차 대회
쉽지만은 않았던 2020, 새로운 시작 2021

본업, 소속

올해 초에 고려대학교 사이버국방학과 를 졸업하였습니다. 150학점을 스트레이트로 이수하며 꽤나 바쁜 4년을 보냈습니다.

거의 휴식없이 2020을 시작하여 주된 소속을 2번이나 바꿨고, 3년간 지냈던 자취방을 떠나 판교로, 판교에서 관악으로...
소속도 주거지도 2번이나 바꾼 정신없는 1년이었네요.

카카오 엔터프라이즈

I am Groot

이론으로만 공부했던 딥러닝을 실제로 넘치는 GPU 리소스를 가지고 실험해볼 수 있어 행복했습니다.
Generation Model에서도 대표적인 GAN, 대표적인 VAE 등을 구현하면서 pytorch 구현 및 환경설정에 대한 자신감을 얻었다는 데 의의를 둡니다.
음성합성셀인만큼 Digital Signal Processing(DSP)TTS의 흐름도 약간이나마 맛보기로 얻어갈 수 있었습니다.

이미 카카오 이야기는 다른 포스팅에서 많이 했으니 나머지는 생략하겠습니다. 😃
판교에서 반년간 지내며 최고의 회사, 최고의 팀, 최고의 팀원 과 함께 해서 행복했습니다.

집단에서 필요한 사람이 되기 위해서 어떤 노력과 과정이 필요할지 설계할 수 있는 시간이었습니다.

서울대학교 대학원

학부 공부 과정과 함께 대학원 준비 과정도 이전 포스팅에서 이야기했기에 준비 과정은 따로 적지는 않겠습니다.
현재 대학원에서 일상은 다음과 같습니다. (80% 이상 재택으로 진행중)

청강, 지도 교수님 수업 정보 시각화(Information Visualization)을 청강했습니다.
팀 프로젝트를 참여했고, 데이터 수집을 담당했습니다. selenium, beautifulsoup 등의 라이브러리를 사용하여 인스타 데이터를 크롤링했습니다.
2017년부터 매년 1회 이상 크롤링을 진행하다보니 점점 필요이상으로 크롤링 스킬이 늘고 있습니다. 좋으면서도 신기하네요.

산학 프로젝트, 기업과 Text Classification 프로젝트를 진행했고, 그 중에서도 전처리 및 모델링을 담당했습니다.
Text데이터셋에 대한 EDA 및 시각화에서 인턴 신분이지만 제 의견이 많이 수용되어 감사했습니다.
Gensim, FastText 등 다양한 텍스트 라이브러리와 scikit-learn 머신러닝 라이브러리를 쉽게 사용할 수 있어 뿌듯했습니다.
개발/협업 측면에서도 어느정도 github-flow를 만들어 작업할 수 있다는 점도 스스로 대견...
초기에 모델링 포지션이었지만 중간에 시각화로 들어가 reactd3를 가볍게 건드리기도 했습니다.

AI(?), 연구실에 계신 분들의 AI-HCI 관련 연구를 보며 여러가지 팔로업하며 지냈습니다.
HCI 랩인만큼 다양한 주제가 연구되고 있었으며 이 과정에서 여러 딥러닝 이야기를 하며 보냈습니다.

랩 세미나, 매주 랩세미나에 참여해서 선배들의 연구나 논문 동향을 듣고, 본인의 1주 업무를 보고합니다.
선배들도 멋지고, 교수님이 해주시는 멘트들이 도움이 되서 좋습니다. 졸업할 때쯤 저도 멋지게 후배들에게 조언할 수 있으면 좋겠다는 생각...?

2021에는 지금 업무에서 조금씩 발전된 형태로 일을 진행할 것 같습니다.
저는 InfoVis와 XAI 분야의 논문을 쓸 수 있을까요? 기대반걱정반.

하여튼 만족도 200%로 연구실을 다니고 있습니다!

'나'는 어떤 개발자일까?

Kaggle

캐글 프로필. 팔로워가 435명이나 생겼다. 틈새 데이터셋 메달까지
Notebook 분야는 데이터 분석 인사이트를 공유하여 upvote를 기준으로 메달과 순위가 갱신되는 분야입니다.

올해 초에 Kaggle Notebook Master가 되었습니다. 이후에 잠시 쉬었고 연말 약 2개월~3개월 정도의 다시 버닝했습니다.
현재는 Notebooks 47위(total 152329, 국내 1위)이며 Gold 9, Silver 6, Bronze 28 를 받았습니다. (작년 1, 3, 14)
만든 노트북만 하더라도 올해 30개 정도 되었네요.

시각화로 끝을 찍고 싶다는 생각으로 라이브러리 matplotlib, seaborn을 포함하여 plotly, altair 등의 공식 문서를 참 많이 읽었습니다.
그리고 대다수의 메달은 시각화를 중심으로 한 데이터 분석 노트북으로 받았습니다. 이렇게 파이썬 시각화 고인물이 되는 것 같아 좋습니다.

중간에 컴페티션도 한 번 참여했지만 203명까지 Bronze 메달에 204등을 한 이후로 잠정적 대회 휴식에 돌입했습니다.

2021에는 컴페티션, 데이터셋 분야는 보라색(Expert) , 노트북 분야는 노란색 (Grandmaster)를 목표로 하고 있습니다.

Github

깃헙 프로필, 팔로워 218명..?

큰 프로젝트를 진행한 건 없는데 팔로워가 늘고 있습니다.
내년에는 제대로 된 프로젝트를 공유해야겠습니다.

커뮤니티 / 블로그

Kaggle Korea, 2년차 운영진으로 4차 대회를 주최하였습니다.
약 4000명 정도일 때 운영진으로 들어갔는데 벌써 12000명이 되었네요.
좋은 커뮤니티에 속할 수 있게해주신 태영님, 유한님, 천성님, 태진님 모두 감사합니다.

Data Visualization KR, 올해 초에 만든 커뮤니티로 페이스북에서 활동하고 있습니다.
약 1600명이 있고, 내년에는 5000명 정도를 목표로 하고 있습니다.
저는 약 60개 정도의 글을 포스팅 했습니다. 1주일에 1개 정도의 포스팅을 했네요.

Blog, 2020은 블로그 조회수 약 17만회를 찍었습니다. 기술 글을 포함하여 25개의 포스팅을 했습니다.

조회수 17만회 달성, 2년 합해서 20만회 이상 달성 :)

ETC, 페이스북 페이지는 올해 많이 못했지...라고 생각했지만 생각보다 많은 글을 공유했네요.

캐글 노트북을 포함하면 생각보다 글을 엄청 많이 쓴 1년이네요. 😃

발표

좋은 발표 기회를 만들어주신 김태영님, 김주성님, 송석리님에게 감사의 말을 전합니다.
올해 유일한 오프라인 발표. 캐글 4차 대회 발표 일부

올해는 발표를 모두 온라인으로 진행했습니다. KCD2020(Korea Community Day 2020)으로 발표를 즐겁게 시작할 수 있을거라 믿었으나 코로나가....
시각화 발표를 열심히 준비하고 있었는데 아쉬웠던 기억이 있네요. 그외에는 다음과 같은 발표를 진행했습니다.

  • Daejeon Learning Day 2020 : How to become Kaggle Notebooks Master?
    • 이미 글로도 썼었지만 좀 다르게 구성하여 발표했습니다.
    • 전문 분야를 발표할 때의 짜릿함이라는게 있죠.
  • T아카데미x캐글코리아 4차대회 : Hello Kagglers!
    • 4차 대회 소개겸 캐글의 흐름을 발표했습니다.
  • Kaggle Learning Day 2020 : Kaggle과 Data Science를 시작하는 이들을 위해
    • 캐글 플랫폼 내에서 대회를 여는 것, 그리고 대회를 운영하기 위해 필요한 점 등을 발표했습니다.
  • 청소년데이터사이언스컨퍼런스 : 나의 개발 이야기 : 컴알못에서 시작한 대학생의 고군분투기
    • 제가 가장 하고 싶었던 발표 중 하나로 고등학생에게 개발 관련으로 발표를 진행했습니다.
    • 5년이나 지났지만 생생했던 고3과 새내기 사이의 기억을 되살리며...
    • 학생들에게는 직접 면대면으로 멘토링을 해주고 싶은 마음이 많은 데 쉽지 않네요.ㅠㅠ

내년에는 한 달에 한 번씩은 발표를 하고 싶습니다. (오프라인으로 하고 싶어요... 코로나 언제 끝나....)

강의

좋은 강의를 제안해주신 모두의 연구소 은수님, 지나님, 정원님 그리고 패스트캠퍼스의 호현님, 민수님에게 감사의 말을 전합니다.
강의를 보조해주신 지원님, 정우님, 시영님에게도 감사의 말을 전합니다.

학교에서 3년간 알고리즘 세미나를 진행하며 알고리즘 및 코딩테스트 강의 는 준비가 없어도 강의를 할 수 있었습니다.
올해 초반에는 회사를 다니며 큰 준비가 없어도 병행할 수 있게 알고리즘 강의를 위주로 진행했습니다.

  • 알고리즘 및 코딩테스트 (3개)
    • T아카데미 기초 알고리즘과 코딩 (5시간)
    • FastCampus 웹프로그래밍12기 : 알고리즘 (3시간 x 6회)
    • FastCampus 백엔드13기 : 알고리즘 (코로나로 중도 취소)

하지만 저의 개인적인 성장에 더 많은 도움을 위해 보다 실용적인 강의로 방향을 틀었습니다.

  • Python과 Data Science (2개)
    • [신한금융x모두연] AI 마스터 과정 : Python과 데이터 사이언스 (7시간 x 5회)
    • 비AI개발자를 위한 AI업무 전환 교육 : Python과 데이터 사이언스 (7시간 x 5회)

처음으로 기업 강의를 진행해보았습니다. 생각보다 체력적으로 많은 어려움이 있어 살짝 고생하기도 했습니다.
저는 강의에서 포기하는 수강생이 없어야 하고, 모두가 얻어가는 게 있기를 목표로 하는 강사입니다.
그래서 2가지 문제에서 좀 많은 고민이 있었습니다.

  • 수강생의 지나친 수준 편차
    • 제로 베이스부터 중급 수준의 개발자까지 있다보니 조금 빠르거나 느리면 너무 아픈 피드백이 들어와 힘들었습니다.
    • 제 선택은 최대한 개인으로 살펴보며 한 클래스 내에서 수준별 수업을 진행하는 것이고
    • 수강생에게는 좋았지만 체력적으로 상당한 소모가...
  • 짧은 기간과 전달해야 하는 양
    • 대다수 기업강의는 짧은 기한 내에 많은 양을 전달해야 합니다.
    • 3주만에 인공지능 마스터는 쉽지 않은 일인 것은 분명합니다.
    • 그래서 저는 수업에는 예시를 최대한 많이 넣는 방식을 선택했고,
    • 자료를 최대한 자세하게 구성하여 후에 복습하기에 편한 자료를 만들기 위해 노력했습니다.

수강생 평가가 9점대 이상이 나왔기에 만족스러운 강의긴 했지만, 분명 힘든 분들도 눈에 보였기에 미안한 마음이 큽니다.
다음에 강의를 진행하면 지금까지 얻었던 인사이트를 바탕으로 더 좋은 강의를 구성해볼 예정입니다.

9.9점의 리뷰

금전적인 이유로 종종 프리랜서로 강의만 1년 뛰고 싶다는 생각도 했지만, 학문적인 목표를 위해 그 점은 포기하기로 했습니다.
앞으로는 온라인 강의나 AI 관련 강의를 위주로 진행할 생각입니다.

내년에는 Visualization for EDA로 강의를 합니다. 그토록 기대했던 시각화에 한정된 강의라니...설레면서 준비중입니다.
Upstage AI와 Naver Connect에게 감사의 말을 전합니다.

변하기 위한 노력과 휴식

위에서 제 자랑같은 후기를 많이 썼지만, 꼭 좋은 순간만 있었다고 하기에는 힘든 1년이었습니다.
몰아치는 일이나 인간 관계 등으로 스트레스 관리를 못하는 순간도 많았고, 그만큼 슬럼프/번아웃도 많았습니다.

일부는 여러 활동을 하며 극복을 하고, 저만의 가치관을 만들기도 했습니다.

여행 / 사람

퇴사하고 2주간 노트북과 기본 옷가지만 들고 강릉, 파주, 대전, 영종도 등으로 떠났습니다.
아무도 저를 모르는 공간에서 커피를 마시며 생각을 정리하는 시간을 가졌습니다.

가까웠던, 가까운 사람을 만나기 위해 연락도 많이 했습니다.
대학교 4년간 잡았던 약속보다 올해 하반기에 잡은 약속이 더 많은 정도입니다.

그 외도 여러 개발자를 만나며 여러 생각을 나누기도 했습니다.

저와 스친 모든 분에게 감사합니다.
특히 저의 생활에 지속적인 환기를 해준 친구들에게 감사의 말을 전합니다.

운동

이때보다 머리가 훨씬 길었고, 몸도 커졌다.

거울 속의 제 모습에 충격을 받고 운동을 시작했습니다.
9개월 정도 운동을 진행했고, 총 4가지 시즌이 있었습니다.

  • s1 (1 mon) : 1일 1식 + 도보 2-4시간
  • s2 (3 mon) : 1일 1식 + 아침 운동 2시간 + 저녁 운동 2시간
  • s3 (4 mon) : 식단 조절 + 매일 운동
  • s4 (1 mon) : 식단 조절 + 홈트레이닝 (현재)

4개월간 약 15kg 체중 감량을 했고, 5개월 동안 근육으로 5kg 정도 증량하였습니다.
모습을 바꾸기 위한 노력이기도 했고, 스트레소 해소의 수단이기도 했습니다.

현재 식단은 약속이 없는 한 닭가슴살과 현미밥을 위주로 먹고, 그 외에도 종종 계란, 아몬드브리즈, 그릭요거트, 견과류, 과일 등을 먹으며 부족한 칼로리를 채우고 있습니다.
관리하는 재미가 일상의 낙 중 하나가 되었네요.

그리고 몸을 만족스럽게 만들기 전까지 머리를 기르려고 합니다. 현재는 장발에 만족중입니다.

2021에는 3대 운동을 360 => 400을 목표로 하고 있습니다.

2021의 목표

위에서도 몇 가지 목표를 적었지만 그 외의 핵심적인 목표들은 다음과 같습니다.

연구 그리고 논문

2020에 개발도 많이 하고 다양한 성과를 냈지만 학문적인 성장은 비교적 부족했던 1년이라고 생각합니다.
일을 줄이고 공부에 더 많은 시간을 투자하고 싶습니다.

  • Information Visualization
  • Deep Learning
  • Math (안하고 싶었지만 해야함을 지속적으로 느껴서..)

디테일한 수학을 제외하고는 다시 블로그에 정리해볼 예정입니다.

본업을 잘해야 다른 일들도 빛난다고 생각합니다.
대학원생으로 가장 멋지기 위해 연구와 논문에 초점이 되는 2021이 되었으면 좋겠습니다.

집필과 출판

한동안 블로그를 포함해 글을 쓸 수 없었습니다.
틀릴까 무서웠고, 표절이 될까도 신경쓰였고, 어떠한 문장도 마음에 완벽하게 차지 않았습니다.
내 글이 실제로는 도움이 안되는 허울뿐인 글은 아닐까 라는 생각도 많이 했습니다.

이제는 저런 부정적인 생각을 이겨내고, 완벽하지 않아도 글을 쓰는 법을 익히고 있습니다.
현재 책을 3권 쓰고 있습니다. 올해 초부터 기획된 책이지만 최근에 다시 집필을 시작하고 있습니다.
책이 나오기전까지는 일단 어떤 책인지는 비밀로 하겠습니다.

내년에는 좋은 책으로 돌아오겠습니다. 😃

기다려주시는 편집자분들에게 정말정말 감사합니다. 얼른 완성하겠습니다...

커뮤니티

개인 홈페이지 및 커뮤니티화, 이제 이 블로그를 확장하여 개인 포트폴리오 및 커뮤니티를 만들어볼까 생각합니다.
목표는 큰데 웹 개발에 시간을 어떻게 할애해야 이 목표가 구현 가능할지 생각해보고 있습니다.

데이터 시각화 컨퍼런스, 국내에 데이터 시각화 관련으로 컨퍼런스를 열어볼 생각입니다.
혼자의 힘으로는 부족하겠지만 주변의 도움을 받아 조금씩 행사들을 열어볼 수 있지 않을까요?

바디프로필

운동을 시작한만큼 내년에는 바디프로필을 찍어보려고 합니다.
원래는 3월쯤으로 예상했으나 헬스장을 못가는 상황이니 시기는 좀 더 지켜볼 예정입니다.

한 3년후에는 아마추어 대회에 참여해보고 싶다는 생각입니다.

유튜브

2020에는 다른 일정이 많아 진행하지 못했던 유튜브를 다시 시작해보려고 합니다.

아마 주요 컨텐츠는 공부를 정리하고 강의로 바로 만들어보려고 합니다.
그래도 재미있게 지식을 전달하는 컨텐츠를 만들고 싶은데... 우선은 고민중입니다.

마무리...

2020에는 제가 할 수 있는 최선을 다했다고 생각합니다.

앞으로 일은 못할 자신이 없습니다. 최선을 다하면 어떻게든 결과가 나올 거라 스스로를 믿습니다.

하지만 여전히 일과 다른 것들에 균형을 맞추는 것은 연습이 많이 필요합니다.
그리고 좀 더 제 주변과 사회에 기여할 수 있는 사람이 되고 싶습니다.

2021은 여러 상황과 환경에서도 이겨낼만큼 더 강인한 내가 되기를 바랍니다.

모두 멋지고 행복한 2021이 되기를 바랍니다. 😃