바쁜 하루하루

요즘 일도 사생활도 너무 바빠서 매일 아주 허덕이고 있다. 지난 일요일은 하루 종일 너무 재밌었는데 일단 시작은 마샤과 하키네 가족이랑 조선옥에 가는 것으로 했다 ㅋ 어른 넷에 아이 둘이었는데 우리가 시킨 음식은: 차돌박이 2인분, 낙지 볶음, 돼지구이, 설렁탕, 해물파전, 냉면, 군만두. 8인분!!! 엄청나게 먹고 남은 거 싸와서 마샤랑 저녁으로 먹고도 또 남았다 ㅋㅋㅋㅋ

식당에 들어가면 무조건 yelp 체크인부터 하는 마샤는 이날도 어김없었고 나도 자리에 앉자마자 남편한테 문자를 보냈는데 그걸 하키가 몰래 찍어서 페이스북에 올린 사진이다 ㅋㅋㅋㅋㅋㅋ


그래서 이날 어쨌든 배터지게 먹고나서 마샤와 나는 둘이 에반스톤에 갔다. 거기에 아주아주 큰 fabric store가 있기 때문... 거기서 재봉틀 수업 때 쓸 천을 샀는데 둘다 이랬다 저랬다 고르는데 시간이 엄청 오래 걸렸지만 결국은 둘다 맘에 드는 옷감을 샀다^^ 거기에 있는 옷감들을 보니 어찌나 만들고 싶은 게 많던지... 진짜 너무너무 예쁜 천들이 많았다.

점심먹고 바로 간 거였는데 가게 문닫는 5시까지 꽉 채워서 쇼핑을 하고 났더니 아주 피곤해졌다. 그치만 천을 골라서 뿌듯한 마음으로 마샤네 집으로 가서 뜨개질을 했다 ㅋㅋㅋ 그리고 저녁먹고 같이 홀푸드가서 그로서리 쇼핑까지 하고 밤늦게 헤어졌다. 어찌나 productive한 주말이었는지 ㅎ

//
어제랑 오늘 이틀은 학교 일이 너무 바빠서 하루 종일 빡세게 일하고 퇴근도 늦게 했다. 컨설팅이 직업이다보니 참 별별 사람들을 다 상대하게 되고 그런데서 받는 스트레스를 우리끼리 '얘기'하는 걸로 많이 풀게된다. 그런데 클라이언트들이 주로 의사들이고 또 우리가 하는 일이 아카데믹한 일이다보니, 가장 큰 흉볼 거리는 멍청한 사람들이다. 잘 모르면서 아는 척하다가 일을 그르쳐서 우리가 뒷처리하게 만드는 사람들. 그들이 제일 골치아프다.

오늘 새로운 클라이언트가 왔는데 내가 박사 때 전공한 분야를 쓸 수 있을 것 같아서 반갑긴 했지만 미팅을 하다보니 어이가 없어서 ㅋㅋㅋ 이제부터 gene signature라는 말을 쓰는 사람들은 일단 신뢰하지 않겠다는 다짐을 했다 ㅋㅋㅋ gene signature에 대해 늘 얘기하고, 페이퍼도 쓰고, 그랜트 프로포절도 쓰는 사람들이 막상 gene signature가 뭔지 명쾌하게 설명하지 못하고 그게 뭔가 굉장히 추상적인, 실체가 없는 어떤 신비로운 것으로 생각하는 것 같다. (만약 그런 것이면 그건 과학이 아니지...)

그들(클라이언트들): 이 페이퍼가 밝혀낸 gene signature가 암환자의 생존을 예측할 수 있대. 그 gene signature가 우리 데이터에서도 암환자의 생존을 잘 예측하는지 validate하려는 게 우리의 목적이야
우리들(통계학자들): gene signature가 뭐니?
그들: 우물쭈물...
우리들: gene list니? 암환자의 생존을 예측할 수 있는 gene들의 목록이니?
그들: 그게 아니고... 우물쭈물...
우리들: 그 페이퍼가 LDA로 gene signature를 만들었다는데, 그럼 암환자의 생존을 예측하는 gene expression들의 linear combination을 계산했다는 말인 것 같은데, 우리 말이 맞니?
그들: 뭐 그런가봐...
우리들: 너네가 validate하려는 게 gene list니 아님 gene들의 linear combination이니? 같은 gene list로 너네 데이터셋에서 새로운 모델을 만들려는 거니?
그들: 그건 아닌 거 같애... 우리는 걔네꺼를 그대로 갖다가 우리 데이터를 대입만 할 거야. 우리 데이터로 다시 LDA를 돌리지는 않을 거야.
우리들: 그럼 그 페이퍼에서 밝힌 gene들의 linear combination을 validate하겠다는 거구나. 그러니까 너네가 말하는 gene signature는 결국 gene들의 linear combination이구나.
그들: 그런가봐...

우리들: 그럼, 그 페이퍼가 밝혀냈다는 그 gene signature를 가져와봐. 그래야 너네 데이터에 적용을 해서 암환자 생존을 예측하는지 못하는지 분석을 하지.
그들: 그게 페이퍼에 안나와있어... 우리가 페이퍼 저자랑 친하니까 달라고해볼게... 근데 정확히 뭐를 달라고 해야되니.
우리들: 뭔말이야. gene signature를 달라고 하면 되지. 니네가 걔들의 gene signature를 validate하고 싶다며. 그럼 그 gene signature를 일단 가져와야지(라고 생각하고 실제로 말은 훨씬 나이스하게 함)
그들: 그니까... 정확히 뭐를 달라고 해야하는지...

... 여기서 확실해진 것이다. gene signature를 validate하겠다는 사람들이, 막상 gene signature가 뭔지 그 실체를 모른다는 것.
설상가상으로... 그들이 그 페이퍼의 저자한테 이메일을 보냈고, 그 페이퍼의 저자 역시 똑같은 헛소리로 답장을 했다...
페이퍼 저자: 우리가 쓴 방법을 알고 싶다는 거니? 우리는 LDA를 썼어.

여기서부터 나는 너무 웃기면서 화가 났다. 지난번에 Bob이랑 일했을 때랑 똑같은 상황. 그래서 페이퍼 저자에게 다시 이메일을 보냈다. '너네 페이퍼에 따르면, 너네가 골라낸 gene 55개의 expression을 x1, x2, ..., x55라고 했을 때, 너네는 암환자가 4년 안에 죽을 확률 = b0 + b1*x1 + b2*x2 +... + b55*x55 라는 공식을 LDA를 통해서 계산했어. 내 말은 너네가 계산한 그 b0, b1, b2, ..., b55의 값을 알려달라는 말이야'

그랬더니 방금 온 답장 왈, 한번도 b들의 값을 프린트해볼 생각을 못했다고... 
내 참, 그 b값들이 그들이 그렇게 부르짖는 gene signature의 실체란 말이다.... 뭐하자는 거야 대체...
이 사람들은 자기들이 밝혀냈다는 게 정확히 뭔지, 어떻게 생존을 예측하는지, 전혀 생각을 안해본 것이다... 디테일은 당연히 비통계학자로서 모를 수 있지만, 대강의 아이디어는 알아야 될 것 아닌가 말이다.... 과학자라는 사람들이...

어휴. 이걸 갖고 conference call을 하잔다. 그리고 b값들이 정 필요하면, 다른 publically available한 데이터셋에 LDA돌려서 구해보란다. 아 그럼 당연히 b값이 다르게 나오지!!!! 너네 바보야!!!!

내가 보기엔, 이쪽 분야, 불량 연구자가 너무 많아서 언젠가 벌거벗은 임금님처럼 곧 망한다. 망해야된다. 뭔지도 모르고 말만 번지르르하게 늘어놓고 과학입네~하는 거, 너무 비양심적이다.