Who has the information ?
부제: 궁금증을 데이터 분석과 통계에 기반하여 해결해보자!
1. Hypothesis development
“쉿,,!! 너만 알고 있어" 인싸들끼리만의 정보, Insider information
전통금융에서 Insider information (내부자 정보)에 대한 사전적 정의는 아래와 같다.
내부자 정보(Insider information)란 아직 일반 대중에게 공개되지 않은 기업의 계획이나 재정에 대한 사실로, 이를 이용할 경우 부당한 이익을 취할 수 있다. 내부자 정보를 바탕으로 주식을 매입하거나 매도하는 것은 형사상 범죄가 될 수 있다.
위 정의를 필자 임의대로 변형시켜 보았다.
크립토 씬에서 인싸들의 정보(Insider information)란 아직 크립토 아웃사이더들은 모르는 블록체인 업계의 최신 정보로, 이를 이용할 경우 편하게 이익을 취할 수 있다. 이러한 인싸들의 정보를 바탕으로 코인을 매입하거나 매도하는 것은 형사상 범죄가 되지 않는다.
크립토 씬에 갓 입학한 뉴비로서 느낀 이 산업의 특징은 “정말, 매우, 아주, 빠르게 움직인다"는 것이다. 누군가가 “크립토 씬에서 1년은 실세계에서의 10년과도 같다”라는 말을 했던 것이 기억에 남는다.
필자는 2020년 여름에 처음 블록체인 스타트업에서 인턴으로 일하며 처음 크립토 씬에 몸담았고, 디파이 썸머를 겪었다. 그러나 그 해 가을에 학업을 이유로 크립토 씬을 떠나있다가 1년 뒤인 2021년 초여름 다시 이 쪽 세계에 발을 들였다. 1년이라는 시간 동안 이 쪽 세계는 정말이지 너무도 달라져있었다. (가격도 많이 달라져 있었다,,)
산업 자체가 빠르게 이동하기 때문에, 똑같이 크립토에 투자하고 있는 유저들이라고 할지라도 정보 수준에서 큰 차이가 있을 것이다. 아래에서 두 유저의 예시를 들어보자.
Alice
유창한 영어 실력 보유
크립토 인플루언서들의 트위터 계정을 팔로우하여 매일 그들이 나누는 이야기들을 파악
Delphi / Messari daily report 구독하여 업계 동향 파악
관심있는 프로젝트의 Discord, Telegram에 입장하여 다른 유저들이 나누는 이야기들을 파악
Bob
영어를 잘 못하며, 한국어로 제작된 자료들만을 선호
네이버 카페, 코인 유튜브 영상, 코인 커뮤니티에서 자료 수집
주변에서 “OO코인 뜬다더라"라는 정보에 동요됨
Bob이 너무 과장되었다고 생각하는가? 필자는 그렇게 생각하지 않는다. 불과 6개월 전의 필자가 그러했으며, 지금도 필자 주변 친구들이 그러하다.
크립토 인싸이더 Alice와 크립토 아웃싸이더 Bob이 각각 파악하고 있는 정보의 양과 질의 차이는 천지차이일 것이다.
검정하고자 하는 가설: 같은 크립토 씬에 참여하고있는 유저들이라도 유저 그룹 간의 정보 격차는 클 것이다.
2. 실험 설계
위에서 설정한 가설을 검정하기 위한 검증된 이론이 필요하다. 이곳 저곳을 뒤져가며 찾은 논문, Lai and Teo (2008)에서 그 실마리를 찾았다. 논문 내용을 간단히 요약하면 다음과 같다. 회사의 실적 발표와 같은 주가에 영향을 주는 이벤트가 예정되어 있을 때, 이벤트 발생 이전에 투자자 그룹별로 움직임 (매수 or 매도)이 다르다.
예를 들어, 실적 발표 후 주가 상승이 예상되는 긍정적 이벤트일 경우 그 정보를 미리 알고 있는 그룹은 해당 회사의 주식을 평소보다 더 많이 매수할 것으로 예측할 수 있다.
필자가 원하는 최종 테이블은 아래와 비슷한 형식일 것이다.
여기서 t가 긍정적 이벤트가 발생한 날이라고 하면 그룹3의 경우 그 정보를 미리 알고, 그 전날 매수를 했다고 볼 수 있다.
그리고 이 Buy, Sell의 정도를 정량적으로 계산하기 위해 Lai and Teo (2008)에서 도출한 STI (Standardized Trading Imbalance) 라는 변수를 사용한다.
이벤트 설정
다양한 이벤트가 많았지만, 필자의 경우 2021년 7월 22일에 진행된 ‘The B word conference’를 가격에 영향을 준 이벤트로 설정하였다. (혹시나 The B word conference에 대해서 잘 모르신다면 여기에 잘 설명되어 있으니 참고하시길,,)
이 컨퍼런스가 유저들에게 얼마나 큰 영향력을 미쳤는지 정량적으로 측정할 수 없겠지만, 필자의 경우 꽤 큰 영향을 주었다고 판단했고 실제로 비트코인 가격 추세도 이 컨퍼런스를 기점으로 반전되었다.
3. 데이터 확보 및 전처리
드디어 데이터 분석에서 가장 시간이 많이 소요되고, 까다로운 단계에 도착했다. 전체 데이터 분석 과정 중 약 60% ~ 80%가 이 단계에서 소요된다고 봐도 과언이 아니다.
필자의 경우, 가장 먼저 원했던 데이터는 거래소 내부 데이터였다. 혹시나 있지 않을까 싶어 구글링도 해보고 거래소 API도 기웃거려 보았지만 당연하게도 (?) 보안 상 공개되어 있지 않았다.
그래서 다음으로 생각해낸 것이 DEX 거래 데이터이다. DEX는 Swap을 통해 거래가 진행되는데, 이 Swap은 온체인에 기록이 남게 되므로 필자가 접근할 수 있었다. 유니스왑의 USDT와 USDC 주소를 이더스캔에서 찾아서, 유저가 USDT/USDC를 받는 트랜잭션을 Sell, 보내는 트랜잭션을 Buy로 정의하였다.
기간: 2021년 7월 22일을 기준으로 +- 3일. 7월 19일 ~ 7월 25일 (1주일)
관측치 개수: 하루 1만건, 총 7만건
1주일 동안 거래에 참여한 지갑 수: 18,305개
USDT/USDC 주소가 From에 있느냐 To 있느냐에 따라서 트랜잭션을 Buy, Sell로 구분
1주일 동안 거래한 금액 중 최대값(Max volume)을 기준으로 다섯 그룹으로 나눔
Plankton: Max volume < $0.1m
Shrimp: $0.1m<= Max volume < $0.25m
Fish: $0.25m<= Max volume < $0.5m
Dolphin: $0.5m<= Max volume < $1m
Whale: $1m < Max volume
4. Result
(1) Quantity (USDT or USDC) 분포
(2) 그룹별 분포
Plankton: 98.3% (17,992 users)
Shrimp: 1.18% (216 users)
Fish: 0.339% (62 users)
Dolphin: 0.0819% (15 users)
Whale: 0.109% (20 users)
(3) STI table (final result)
파란색 박스: 이벤트가 발생한 날의 그룹별 STI 값
빨간색 박스: 90% 이상의 확률로 유의한 값
STI 값은 z 값으로 볼 수 있다. 따라서 z 검정을 통해 통계적 검정을 진행할 수 있다. 위 종모양 면적의 총합은 100%이며, 파란색으로 색칠되어 있는 면적은 90%이다.
이는 곧 “STI 값이 -1.65이상 1.65이하인 경우, 그 값이 사실상 0일 확률은 90%이다.”라고 해석할 수 있다.
즉, 이러한 통계적 사고를 바탕으로 테이블을 다시 해석해보면 빨간색 박스 표시가 되어 있지 않은 부분들은 사실상 90% 확률로 0이다. = Buy와 Sell 중 어느 것도 우세하지 않다.
그러나 빨간색 박스가 쳐져 있는 부분 세가지는 이러한 90% zone을 벗어나서 위치해있다. 즉, 이 세 값들은 90% 확률로 STI 값이 0보다 크며, 즉 90% 확률로 “매수” 로 해석할 수 있다.
(4) 결과 해석
이벤트 발생 전 비트코인을 매수한 그룹은 Fish 이다.
이벤트 발생 직후 비트코인을 매수한 그룹은 Dolphin, Whale 이다.
-> 거래 사이즈가 큰 그룹인 Dolphin, Whale 보다 상대적으로 사이즈가 작은 Fish 그룹이 컨퍼런스가 진행되기 전 날 다양한 코인들을 매수하며 기민하게 움직였으며, 상승장의 시작과 함께 Dolphin, Whale 그룹이 매수를 진행하며 그 추세를 강화시켰다.
-> 크립토 인싸 그룹은 Fish 이다.
(5) 한계 및 보완점
Etherscan API를 이용하는 법을 숙지하지 못해 온전한 데이터 확보에 한계가 있었음. 추후 이를 보완하여 더욱 질이 높은 데이터 + 실시간 Trading Imbalance 차트를 제작할 수 있을 것으로 보임
이번에 진행한 분석은 단일 거래소, 단일 이벤트, 스테이블 코인이 포함되어 있는 페어만을 대상으로 진행했기 때문에, 전체적인 동향이라기 보다는 “유니스왑에서 USDT 또는 USDC가 포함된 거래를 7월 22일 전후 3일 동안 실행한 유저“만을 대상으로 분석에 사용했다는 한계가 존재함
Fish, Dolphin, Whale으로 나누는 기준을 Uniwhales (유니스왑에서 큰 금액의 스왑이 발생하면 alert를 주는 서비스) 의 기준으로 사용하였으나, 이 부분을 목적에 맞게끔 정교화하여 설정한 뒤에 분석한다면 다른 결과가 도출될 수 있음
DEX를 쓴다는 것만으로도 어느정도 크립토 씬에 깊게 참여하고 있다고 볼 수 있음. 따라서 위에서 언급한 Bob과 같은 유저는 이 분석에 포함되지 않음.
최대 거래 금액만으로 유저 그룹을 나누는 것이 아니라, 보다 다양한 기준으로 유저 그룹을 나눈다.