윈디하나의 누리사랑방. 이런 저런 얘기

글쓴시간
분류 이야기
블로그 스팸 등록

작년 말부터 스팸성 댓글, 트랙백이 부쩍 늘어났습니다만, 지금은 다시 줄어든 느낌이네요. 스팸으로 등록되는 건수에 큰 차이가 있습니다. 다행이네요.

사용자 삽입 이미지

- 텍스트큐브의 스팸필터가 좋아졌다는 느낌입니다. 예전에는 전체 스팸의 절반 정도 차단해줘서 나머지는 수동으루 지웠는데, 지금은 90% 이상 차단하네요. 그나마 관리하기 편해졌습니다.

- 요즘 스팸은 트랙백 스팸이 기본이고, 레퍼러 스팸도 많이 보이네요. 레퍼러 스팸은 제가 임의로 이름을 지어낸겁니다. 링크의 '출처'를 나타내는 HTTP 헤더이름이 레퍼러(Referer)인에 이걸 조작해 저같은 관리자의 방문을 유도해 내는 셈입니다. 그다지 유용하다고는 생각되지 않습니다만, 그래도 처음엔 몇번 낚였네요. 지금은 아예 클릭 안해봅니다.

- 외국에 보면 SEO(Search Engine Optimization)라고 해서 '검색엔진최적화'를 하는 업체들이 많습니다. 최적화하고자 하는 사이트의 링크가 많을 수록 검색엔진에 노출되는 건수가 많아지기 때문에, 유명한 블로그에는 링크를 걸기 위한 트랙백이나 코멘트를 달아놓습니다. 그래서 SEO를 실현하는 거죠. 일일이 막는건 너무 손이 많이 가고, 자동화해서 막아야 하는데, 이런 걸 제공해주는 서비스를 스팸방지 서비스라 합니다. 텍스트큐브의 스팸 방지 서비스인 FAS도 그중 하나입니다. 전 세계적으로는 워드프레스를 만든 Automattic사에서 운영하는 Akismet 이 유명합니다. 이 서비스는 영문 스팸 필터로써는 최고라고 알고 있습니다.

- 스팸 차단 서비스를 사용하는 것 외에도 캡챠(CAPTCHA, Completely Automated Public Turing test to tell Computers and Humans Apart, 완전 자동화된 사람과 컴퓨터 판별)를 사용하는 방법도 있습니다. 스팸은 대부분 프로그램으로 등록되기 때문에, 기계가 인식하기 힘든 글을 쓴 이미지를 보고 글의 내용을 입력하라고 하면 기계는 못 하죠. 쉽게 말하면 어린 아이들이 쓴 한글을 한글 인식기계에 넣으면 거의 인식 못한다는 걸 이용한 겁니다. 물론 어른들, 특히 유치원 교사들은 뭐라고 썼는지 잘 알겠지만요. 개인적으로는 기계인지 인간인이 구분 할 수 없을 정도로 기술이 발전하길 바라지만, 제 블로그에 스팸이 많아지는건 원하지 않습니다.

사용자 삽입 이미지

캡차의 하나. 이미지에 표시된 수식을 계산해 입력하면 사람으로 간주한다.


- 글고보니 제 블로그의 스팸도 100% 영문이네요. 예전엔 영문으로 된 문장을 완전히 차단하는 스팸필터를 사용하곤 했는데, 지금은 사용하지 않습니다. FAS도 쓸만하기 때문이죠. 그냥 영문만으로 이루어진 글을 차단해버리면 되지 않을까 생각도 해봅니다만 국제화에 거스르는 셈이 되려나요.
글쓴시간
분류 이야기
텍스트 큐브 FAS

사용자 삽입 이미지

Frypan Anti Spam 플러그인 아이콘


텍스트큐브는 FAS(Frypan Anti Spam)라는 안티 스팸 솔루션을 제공해주는데요, 공개된거 치고는 굉장히 강력합니다.

그런데 정상적인 글도 문제가 있었다고 하네요. 글을 쓰려면 아래와 같이 JSON응답이 왔었습니다.

<response>
<error>1</error>
<description>귀하는 차단되었으므로 사용하실 수 없습니다.</description>
</response>

귀하~ 부분은 오류 메시지입니다.

지금은 해결되었다고 하네요. ㅎㅎ

----

http://antispam.textcube.org/
글쓴시간
분류 이야기
텍스트 큐브 스팸 방지 플러그인 활성화

- 블로그에 일정 수준의 방문자가 들어오게 되면, 텍스트 큐브에 기본 등록되어있는 FAS 활성화가 필요하다. 스팸 차단 모듈은 어차피 완벽한건 없지만, 하루에도 수백개 넘께 달리면 관리하기 힘드니 어느 정도는 막아줘야 하는데 말이지. 90% 정도는 차단한다고 한다.

사용자 삽입 이미지

FAS 활성화한 화면


- 관리자로 들어가서 플러그인 메뉴에 진입한 다음, FAS를 활성화 하면 됨.
글쓴시간
분류 이야기

현재 서버 상황

- 블로그 운영하는 서버가 느려진것 같아 서버에 접속해 확인중이다.

역시 CPU 가 빨리 응답하지 못하고 있다. 좀 의외다. 사용자가 별로 없는건데 이렇게 느릴 줄이야. CPU 는 아래와 같이 20% 미만으로 사용하고 있지만, 응답 속도가 매우 느려서 답답하다.

SunOS xxx 5.10 Generic_xxxxxx-xx i86pc    02/11/2014

00:00:00    %usr    %sys    %wio   %idle
01:00:00      12       1       0      87
02:00:00      11       1       0      88
03:00:00      10       1       0      89
04:00:01      13       1       0      86
05:00:00      15       1       0      84
06:00:00      13       1       0      86
07:00:00      14       1       0      85
08:00:00      11       1       0      88
08:20:00      12       1       0      87
08:40:00      15       1       0      84
09:00:00      12       1       0      87
09:20:00      12       1       0      87
09:40:00      13       1       0      86
10:00:00      13       1       0      86

Average       13       1       0      86

- AMD의 저가 CPU(Sempron 3000+ 으로 기억. 뜯어볼 수 없다) 을 사용(요즘 파는 셀러론보다도 낮음)하긴 했지만, 여태까진 느린거 못 느끼다가, 평균 CPU사용률이 15% 되는 시점부터 느리다는 생각을 하고 있다. 확실히 서버 트래픽이 많아지긴 많아 졌다. ㅎㅁ 서버 업그레이드 할 때가 온건감. 일단 좀 튜닝해보고 안되겠다 싶으면 다른 서버로 옮길 예정이다. 근데 지금 요청오고 있는 액세스 로그를 보면 스팸성 트래픽인것 같다.

- 그래도 이 서버는 나름 소비 전력이 매우 낮은 편이라 전기세도 안들고 좋았는데 말이다.

----

- 현재 정상임. 캐시로 CPU점유 5% 줄이고 PHP가속기로 CPU점유 5% 줄였다. 지금은 5% 내외임. 응답속도도 좋아졌다. ㅎㅎ

글쓴시간
분류 기술,IT

스팸 댓글에 대한 단상

요즘 이상하게 스팸 댓글이 많아지는 상태. 하루에 최소 백여개는 달린다. 일일이 클릭해 지우는 것도 귀찮아 데이터베이스에 직접 접속해 지운다. 너무 많아지면 아예 프로그램을 만들까 생각중. 그래도 몇분 지나면 또 몇개 달려있다. 시도 때도 없이 꾸준히 들어오고 있는 중.

사용자 삽입 이미지

스팸 댓글을 조회한 DB결과 이미지. 현재는 삭제했다. 보이는 URL에 접속하면 안된다

스팸 댓글/트랙백은 주로 자신의 블로그가 검색엔진 키워드 검색 결과의 상위랭크에 노출되면 등록된다고 한다. 스팸 업자들이 그런 블로그만 노리기 때문이다. (또 상위랭크 블로그에 스팸 댓글을 달아야 효과가 있다) 필자의 블로그는 몇 페이지 빼곤 검색엔진 상위권에도 없는데 말이다.

참고로 스팸을 막기 위한 이렇다할 방법은 없다. 필터를 강화하는 방법 외에는. IP가 일정하기 않은데다, 스팸 필터 넣기 힘들도록 단어도 우회할 수 있는 걸 선택하는 듯.

안지울 수도 없다. 사이트 품위를 지켜야 하고, 스팸댓글에 사용되는 링크와 같이 엉뚱한 링크가 많아지면 검색엔진이 '이 블로그는 스팸 블로그'으로 판단해버려 패널티를 주기 때문이다.

글쓴시간
분류 기술,IT

블로그 관리 및 트래픽 올리기

1. 포스팅 회수

[일주일에 7개]보다는 [하루에 한개]씩 포스팅하는것이 가장 좋다. 각종 검색 엔진에서 방문하는 최대 회수가 2주에 한번이기때문에 최소한 이에 맞춰 포스팅 해야한다.

2. 제목은 두번 쓸것

HTML의 H1태그를 사용하면 금상첨화지만 그게 아니라면 하는 수 없다. 본문에 제목과 같은(!) 내용을 한번 쓸것. 윈디하나의 블로그도 그 컨셉을 유지하고 있다. 단 키워드 검색을 위한 메타 키워드 삽입이라던가, SEO(Search Engine Optimization, 검색 엔진 최적화)같은건 전문 블로그나 전문 사이트가 아니면 무용지물이니 현혹되지 말자. SEO도 한번 해놓으면 끝까지 효과를 보는게 아니라, 검색엔진 알고리즘은 계속 조금씩 조금씩 바뀌기 때문에 지속적으로 해야 한다. 그리고 경험상 남들 다 하는거는 해봤자 소용 없다.

3. 코맨트와 트랙백

절대적으로 코멘트와 트랙백이 많아야 한다. 단 쓸데없는 스팸 트랙백과 코멘트는 반드시! 바로! 삭제할 것. 검색엔진엔 각 사이트마다 점수를 매기는데, '질 낮은 사이트'로 걸려있는 링크가 많은 블로그는 관리가 안되는 사이트로 간주해 해당 블로그 사이트의 점수도 깎는다.

4. 메타 블로그 사이트

검색엔진외에 다음의 블로거 뉴스(http://bloggernews.media.daum.net), 신지식(http://k.daum.net), 올블로그(http://www.allblog.net), 블로그코리아(http://www.blogkorea.net), 한RSS(http://hanrss.com) 에 등록해 놓을것. 주의: 트래픽이 너무 높으면 높은 트래픽을 감당하기 위해 비용이 발생할 수 있다. 가볍게 운영하려면 올리지 말 것.

5. 정보성 내용을 쓸것

내 소개는 필요 없다. 내 사생활은 필요 없다. (단 자신의 사생활을 평생동안 쓴다면(=일기) 그것은 매우 높은 가치를 지닌다) 그런건 방문자의 흥미 유발에 한계가 있으니깐. 최소한 사용기정도는 되어야 좋다. 전문 잡지 수준의 정보성 글이면 오케이다. 또한 뉴스에서는 하기 힘든 비평글이나, 비교글, 의견글, 광고글, 일생 생활의 노하우 같은 글도 매체가 쉽게 따라하기 힘들기 때문에 좋은 내용이 될 수 있다.

6. 서비스

블로그를 운영하는 서버가 다운되면 1∼2주일간 방문자수 20%는 줄어든다. 블로그를 활성화 시키려면 좀 비싸더라도 서버가 안정적인 곳을 찾아야한다. 또한 백업에도 신경써야 한다. 데이터를 날리면 수년간 노력했던 수고가 한순간에 물거품이 된다. 또한 검색엔진이 자신의 블로그 내용을 가져가지 못하게 막아놓은 사이트도 있는데 당연히 이런곳은 피한다.

글쓴시간
분류 기술,IT
스팸방지를 위한조치

잊을만 하고 좀 풀어주면 다시 스팸이 붙네요. 일단 다시 조치해놨습니다.

1. 코멘트 스팸 방지를 위해 영문만으로 된 코멘트는 달 수 없습니다. 사용하실때 참고해주세요.

2. 트랙백 스팸 방지를 위해 트랙백 서버가 정말로 존재하는지 확인합니다. 태터툴즈 1.0.5 기능입니다. 트랙백 처리가 조금 늦어지겠지만 어쨌든 트랙백 스팸은 확실하게 제거되겠네요.

이렇게 두가지입니다. 레퍼러 상으로는 구글 제팬에서 오는것으로 되어있지만, 아무래도 레퍼러 조작된듯 하네요. IP 추적결과 루마니아인것으로 확인했습니다. 아마 이 IP도 조작되었을 가능성이 높겠습니다만, 그나마 우리나라에서 온건 아니라 다행이네요.
글쓴시간
분류 이야기
2개월 걸렸군요.

이 블로그에 xyz같은 넘들이 !#$%^&*같은 댓글을 달기까지요. ^^ 이 블로그는 불특정 다수에게 공개되기 때문에, 이런 일도 생기네요. ㅎㅎ 에혀. 스팸 답글 지우는것도 일인뎅. 끄긍.

이것때문에 친구들의 다른 블로그와 일부러 링크를 안 걸었습니다. (블로그 개설한 친구도 몇 안되지만 ^^) 여기 링크 타고 들어가거든요. ^^

----

아무래도 안되겠습니다. ㅎㅎ 몇가지 플러그인설치 완료. 트랙백 스팸과 코멘트 스팸을 막기 위해 이런것도 해야되는군요. 영어로만 된 답글은 달리지 않도록 해놨습니다. 국제화시대에 역행하는 단점이 있지만, 임시적으로 이거라도 써야겠네요. ^^