윈디하나의 누리사랑방. 이런 저런 얘기

글쓴시간
분류 이야기
블로그 스팸 등록

작년 말부터 스팸성 댓글, 트랙백이 부쩍 늘어났습니다만, 지금은 다시 줄어든 느낌이네요. 스팸으로 등록되는 건수에 큰 차이가 있습니다. 다행이네요.

사용자 삽입 이미지

- 텍스트큐브의 스팸필터가 좋아졌다는 느낌입니다. 예전에는 전체 스팸의 절반 정도 차단해줘서 나머지는 수동으루 지웠는데, 지금은 90% 이상 차단하네요. 그나마 관리하기 편해졌습니다.

- 요즘 스팸은 트랙백 스팸이 기본이고, 레퍼러 스팸도 많이 보이네요. 레퍼러 스팸은 제가 임의로 이름을 지어낸겁니다. 링크의 '출처'를 나타내는 HTTP 헤더이름이 레퍼러(Referer)인에 이걸 조작해 저같은 관리자의 방문을 유도해 내는 셈입니다. 그다지 유용하다고는 생각되지 않습니다만, 그래도 처음엔 몇번 낚였네요. 지금은 아예 클릭 안해봅니다.

- 외국에 보면 SEO(Search Engine Optimization)라고 해서 '검색엔진최적화'를 하는 업체들이 많습니다. 최적화하고자 하는 사이트의 링크가 많을 수록 검색엔진에 노출되는 건수가 많아지기 때문에, 유명한 블로그에는 링크를 걸기 위한 트랙백이나 코멘트를 달아놓습니다. 그래서 SEO를 실현하는 거죠. 일일이 막는건 너무 손이 많이 가고, 자동화해서 막아야 하는데, 이런 걸 제공해주는 서비스를 스팸방지 서비스라 합니다. 텍스트큐브의 스팸 방지 서비스인 FAS도 그중 하나입니다. 전 세계적으로는 워드프레스를 만든 Automattic사에서 운영하는 Akismet 이 유명합니다. 이 서비스는 영문 스팸 필터로써는 최고라고 알고 있습니다.

- 스팸 차단 서비스를 사용하는 것 외에도 캡챠(CAPTCHA, Completely Automated Public Turing test to tell Computers and Humans Apart, 완전 자동화된 사람과 컴퓨터 판별)를 사용하는 방법도 있습니다. 스팸은 대부분 프로그램으로 등록되기 때문에, 기계가 인식하기 힘든 글을 쓴 이미지를 보고 글의 내용을 입력하라고 하면 기계는 못 하죠. 쉽게 말하면 어린 아이들이 쓴 한글을 한글 인식기계에 넣으면 거의 인식 못한다는 걸 이용한 겁니다. 물론 어른들, 특히 유치원 교사들은 뭐라고 썼는지 잘 알겠지만요. 개인적으로는 기계인지 인간인이 구분 할 수 없을 정도로 기술이 발전하길 바라지만, 제 블로그에 스팸이 많아지는건 원하지 않습니다.

사용자 삽입 이미지

캡차의 하나. 이미지에 표시된 수식을 계산해 입력하면 사람으로 간주한다.


- 글고보니 제 블로그의 스팸도 100% 영문이네요. 예전엔 영문으로 된 문장을 완전히 차단하는 스팸필터를 사용하곤 했는데, 지금은 사용하지 않습니다. FAS도 쓸만하기 때문이죠. 그냥 영문만으로 이루어진 글을 차단해버리면 되지 않을까 생각도 해봅니다만 국제화에 거스르는 셈이 되려나요.