Skip to content

1024 회의록

Sungbum Um edited this page Oct 24, 2019 · 1 revision

뭘 만들 것인가?

  1. FDS
    • 현업에 더 가까움
    • clustering 해서 이상 거래를 탐지하고 알려준다. 시각화 포인트는 좀 더 생각해봐야 함.
  2. 분석가가 사용하는 interactive한 툴
    • 점수가 더 잘 나올 것 같음. 교수님이 언급하신적이 있기 때문에
    • 예를 들어 나는 정보보호담당자인데, 카드 결제 트래픽에서 이상 거래 패턴을 찾아내서 그 패턴을 rule로 등록하고자 한다. 또는 나는 데이터 마이닝 하는 사람인데, 카드 결제 트래픽에서 이상 거래 패턴을 찾아내고, 이상 거래를 저지르는 사람들은 어떤 특성을 가진 사람들인지를 알아내고자 한다. 이상 거래인 줄 알았는데 정상 거래인 트래픽의 특징은 뭐가 있나? 이런 것들.
    • 사람A가 어떤 이유로 뭔가 이상 거래 패턴을 알아내고 싶어서 이 시스템을 이용하는데 기본 화면에서 어떤 단서를 찾고 추가적으로 좀 더 자세히 보기 위해서 뭘 눌러서 데이터를 또 어떻게 시각화하고... 이런.. 이런거.

FDS를 하기로 결정.

그럼 해야되는건?

1차 목표 clustering을 해서 잘 탐지하는 모델을 만들고
만들다 보면 이거 시각화하면 괜찮을 것 같은데? 싶은 생각이 드는 걸 나중에 시각화.

clustering이 1차 목표이니까, 어떻게 clustering할 것인가?

첫 번째 논문에 따르면 FDS에서 사용하는 clustering 방식은 5가지.
그러나 이걸 다 제공할 것은 아니니까...

  • 리얼월드 FDS가 사용하는 clustering 알고리즘이 무엇인가? 조사.
    • 네이버 지인에게 물어보았으나 사내에서도 공개를 꺼려해서 알 수 없었음. 그냥 최신 기술 위주로 서치해봐야 할 듯.
  • 전처리로 dimension reduction도 하는가?
  • 시각화도 하는가?

조사 결과를 바탕으로 이 알고리즘들에 대해서 공부하고 논문 참고해서 구현.

보고서는? 어떤 내용이 들어갈 것인가?

  • FDS에 쓸 알고리즘이 머머머다. 대충 1페이지?
  • 이 알고리즘에 대한 설명 대충 2페이지
  • 데이터에 대한 설명 1페이지 정도?
  • 시각화에 대한 설명 1페이지 정도?

할 일 정리.

  • 제일 먼저 해야 할 것 : FDS의 최신 기술 현황. 공유.
  • 그 다음에 할 것 : 알고리즘에 대한 조사
  • 그리고? 보고서 작성