違法ダウンロード、キタ────!

発端は 7/1 の glace.me サーバのログがおかしいことだった。どうおかしいかというと、特に新しい更新ぶつも何もないのに、1 日 15,000 ユニーク IP 来ていたからだ。ハテ? どっかのニュースサイトに載ったのかなぁ?と思いながら、Referer を調べて見ると……。
あ、ちなみに Referer とは glace.me 上のデータがどこのサイトから参照(reference)されたかが記録されている、ログの中の一項目である。HTML に限らず、ブラウザでアクセス出来るすべてのデータはブラウザでアクセスすると、その前はどこのページにいたか記録されるのだ。ただこれはブラウザがサーバに返している情報なので、ブラウザ側で偽装は可能である。例えばセキュリティ対策ソフトではこの Referer を返さないようにできるものもある。
ただ Referer を返さないとちゃんとページを表示しないサイトもあるので要注意だ。fc2 さんや itmedia さんなんかは Referer がちゃんと設定されていないと画像ファイルにアクセス出来なかったりする。

で、ウチに大量にアクセスが増えていた原因は、海賊版の BitTorrent のインデックス・ファイルを配布しているサイトだった……orz しかも 2 サイトもある。その時の twitter の記録は、以下の通り。

この用は違法ダウンロードサイトからオフィシャル・サイトにリンクを張るという神経がよう解らんw 掴まるリスクはないと踏んでいるのかなぁ? ちなみにその後も別のダウンロード・サイトにバナーを貼られ、その時は DDos 攻撃化してしまい、バナーを置いてある dl.glace.me がダウンしかかった。
やっぱり凄いんだな、違法ダインロード・サイトの人気。アフィリを貼っておいたら、きっと笑いが止まらないほど儲かるんだろうな。

ただここでもう一つの希望が。
前に日記にも書いたけれど、「寄付画面」ってやっぱり意味があるんじゃないかなってこと。最低でも英語で「このソフトを無料で手に入れた方へ」とか言うボタンを作っておいて、コピーへの影響を説明し、寄付先及び寄付の方法を記した画面をつけたら寄付をしてくれる人がいるんじゃないだろうか?
まったく無駄じゃないとおもうんだよねー。
もしくは、OVER DRIVE さんがやっていたような amazon の欲しいものリストの公開とかね。

twitter に仕掛けてある単語

4 月頃からかなぁ…… twitter に検索単語を仕込んで、それを表示させるようにした。どういうことかというと、twitter に検索文字列を仕掛けておくと、世界中のツイートからその検索文字にマッチするツイートがあったら、そのツイートを表示してくれるというヤツだ。
個人的にはやりたくなかったのだけど、なんつーか、もっと意思表示した方がいいと思い直し、仕掛けたしだいである。
まず三つの項目に分けた。

  • GLacé ブランド -> 1/2 summer や新作に関する単語
  • Galette ブランド -> ロリ専門ブランド Galette に関する単語
  • 大和 環関連 -> 自分自身に関する単語

具体的な引っかけている文字列は以下の通り。

  • “1/2summer” OR “1/2 summer” OR “glace.me” OR “Timepiece Ensemble” OR “タイムピース”
  • “サンタフル” OR “お兄ちゃんシェアリング”
  • “skysphere” OR “大和環” OR “大和 環” OR “宇奈月けやき” OR “宇奈月 けやき” OR “luvwave” OR “luv wave” OR “amatsukami.jp” OR “amatsukami.jp” OR “TAMA Networks”

“glace.me” で引っかけると、Galette も上がってきちゃうんだけどね。なにせ、Galette のサイトのアドレスも glace.me なので。「いろは」や「翼をください」「C2H6O」が入ってないのは、一般的な単語過ぎて自分の作品以外のことしか引っかからないから(汗)。なんかこの辺、うまい検索の仕方があるといいんだけどなぁ。
で、関連するツイートがあったら積極的にリツイートしたり、引用したりするようにしている。まー、今のところは「生きてるよ~」って表明ぐらいにしかなってないけど……。もっと同人とかで自分の作品が作れていればねぇ、こういうツイートも意味があるのかもしれないが……。

そんなわけで、ツイートでいろいろと邪魔をするかもしれませんが、生暖かく見守って下さいませ。
metrotwit

サーバの増強

bs_zuho01h
ブランドの公式サイトを運営するサーバを一つ上のコースに変更した。具体的に言うと、SAKURA VPS の 1G コースから 2G コースへ。1G コースではメモリがまったく足りず、土日は Apache の同時接続数を上回ってしまうという状況になっていた(関連記事:落ちる glace.me)。
関連記事にあるようにこれの原因は WordPress をつかっているからで、WordPress を使わずにすべて静的 HTML に移行すれば解決するのだが、年齢認証の所やメニューの構造などでべったりと WordPress に頼り切ってしまっていて、今更静的 HTML とか無理っす! ってことで、2G コースに移行することに(ぁ
で、石狩のデータセンタだと初期費用無料という言葉に目にくらみ、石狩にしてしまった。けど、ダウンロード・サーバも石狩なのよね(汗)。なので、旧公式サイトをダウンロード・サーバにして(こちらは大阪)、公式サイトを石狩にすることにする。
まぁこれらのサーバは Linux なのでボク自身がやるんじゃないんだけどね(ぁ

というわけでアクセスが少なくなり始めた AM3:00 頃、公式サイトを停止し、作業は 1 時間ほどで終了。2G コースにして、CPU コア(仮想)が 2 から 3 に、そしてメモリは 1GB から 2GB に。問題はメモリだったので、メモリはほぼ倍増したことになる。んで、同時接続数を倍に……とはせずに、30 から 50 にした。それでも重くてガタガタということはなくなったようだ。ちなみに Apache の同時接続数のデフォルト値は 200 なので WordPress をつかっていることにより 1/4 にパフォーマンスが落ちていることになる。うーむ……。VPS で WordPress ってのがやっぱりキツいのかなぁ。

apache_processes-day
グラフで見ると、ちょうど真ん中ら辺の Fri 00:00 アタリがぴったり 30 で頭打ちになっている。この間はめっちゃ重くなってしまっていた。Fri 12:00 で 30 を越えてグラフが伸びているのはもう 2G コースになっているからである。

コリジョン?

社内 LAN が時々おかしなことになることがあったのは前から認識していた。納期前の修羅場ということもあり、とりあえずルータをリセットすると  24 時間くらいは大丈夫なので、だましだましつかっていた。が、ボクらのつかっている建物に、どんどん本社から人が移動してきて、20 人を越えるようになってきた。さすがにその状態で LAN がおかしいというのは問題だろうということで、本格的に調査することにした。

まず症状はとにかくひたすらネットが重くなると言うことだ。普通にネットサーフィンもままならない。LAN 内のマシンに Ping を飛ばしても 1000msec 以上反応が返ってこないことがザラな状態である。また、ルータをリセットすると直ることから、ボクは最初、ルータを疑った。とはいえ買ったばっかり(8 ヶ月くらい)なんだよなぁと思いつつ、ルータのインジケータを見てみると、けたたましく LED が明滅している。
うへ、これループじゃネーの? というわけで、みんなが帰って一人で残っているときに、まずルータから HUB につながっている LAN ケーブルをすべて抜いた。ところが LED は相変わらずけたたましい。おやぁ? あと刺さっているのは、無線 LAN アクセス・ポイントとサーバだけなんだけど。というわけで、無線 LAN アクセス・ポイントの LAN ケーブルを抜く。
しかし症状変わらず。

ええっ!? サーバなの!? なんでっ!!??

サーバは二枚の NIC がありそれぞれ別の IP アドレスが割り当てられている。とりあえず、主サービスを提供している側(もう片方は SMB しか提供していない)の LAN ケーブルを抜いてみると見事に LAN が正常に動作するようになった。うへぇ、サーバがいったいどんな悪さを!?

それからというもの、サーバで提供しているサービスを一つ一つチェックするという地道な作業が……。もう一つ恐怖心もあった。これが朝まで直らなかったら、20 名以上の社員が仕事にならなくなる。そんなことになったら、会社全体に大きな損失を与えることになってしまう。うひー!!
で、ふと思ったのが、主に起きるトラブルが、まぁ LAN そのものが重いってのもあるんだけど、名前が引けなくなるってことなんだよね。名前が引けない──名前解決が出来ない──っていうのはどういうことかというと、インターネットというのは IP アドレスという数字で自分や相手を特定するんだけど、数字だけではとてもじゃないがわかりにくいし、数字が変わったときに対応しづらい。そこで名前を数字にしてくれるサービスというのがある。
たとえば、amatsukami.jp というのは「61.115.113.146」という数字が割り当てられているんだけど、みんなボクのサーバにアクセスするのに「61.115.113.146」なんて数字は入力していない。「amatsukami.jp」という名前でアクセスしている。つまり「amatsukami.jp」に行きたいんだけどっていうのをとある場所に投げると、それは「61.115.113.146」ですよって答えを返してくれるサーバがあるのだ。それを DNS サーバっていって、だいたいプロバイダによって提供されている。
うちの会社の場合、この社内サーバが DNS を提供している。

ところが、だ。この DNS サービスを 2 枚の NIC 、両方でサービスしていた。この NIC にはそれぞれ異なる IP アドレスが割り振られている。仮に IP:192.168.100.1 と IP:192.168.100.2 としよう。

どういうことが起きるか? じつはボク自身、よく解ってない(マテ)。
たとえば「amatsukami.jp」って何番? っていう問い合わせに対し、192.168.100.1 と 192.168.100.2 両方から「61.115.113.146」だよって答えを返してしまう。LAN 内にまったく同じデータが、異なる IP アドレスから発信される。それが何か悪さをしているとか? でもそもそもクライアントは 192.168.100.1 にしか問い合わせに行かないはずだ。ということは名前解決ではなくて、DNS 広報(DNS の情報を他の DNS サーバに伝える)の方で同じようなことが起こっているのだろうか?
いずれにせよ、この二つの IP アドレスでサービスしている DNS サービスを、メインのアドレスのみにしたら直った。
ひー、朝までに直って良かった~~~。ちなみにその時のツイート

Google 検索のすごさ

去年の 8 月に Windows 8 をインストールしてからと言うもの、検索エンジンはずっと Bing を使い続けている。理由はデフォルト設定のまま変えてないだけだ。同時に Bing がどこまで使えるかというのにも興味があった。確かに普段使っている分には Bing でも特に困ることはない。前にもどこかで書いたかもしれないが、Bing はどうも Google よりも一般向けにしているっぽい。
それは特に一般の世界でも使われているオタク用語を検索すると顕著である。あと一般の世界でも使われているエロワードもかな。Google ではおそらくアクセス頻度やリンクされている数を正直にカウントして検索結果を出しているように見える。なので一般的な言葉でも、ネットスラングとしてネットの世界ではよく参照されるような言葉の場合、ネットの世界の方の意味での使われ方の方が上位に来る。エロとかオタクとかお構いなしだ。
ところが Bing で検索すると先に一般で使われている意味での方が上に来る。
たとえばうちのブランドから出る今月発売予定の「サンタフル☆サマー」というエロゲだが、Bing で「サンタフル」という単語を検索すると一位に「ヤマモモと三太の 日々是サンタフル」という犬とのブログがトップに来る。そして二位が「サンタフル☆サマー」なんだけど、ショップで公式サイトではない。が、Google では公式サイトがトップに来て、それから 13 位までサンタフル☆サマーで、14 位目に「ヤマモモと三太の 日々是サンタフル」が来る。
万事が万事そんな感じで、Bing はボクから見ると、オタク系やエロ系の優先度を意図的に下げているように見えるのだ。

あと技術的な検索に関しては、特に二つに優位差は見られなかった。ボクはどちらでも検索している。おおむね同じものがヒットするのだが、所々違うので、どちらも重宝している感じだ。

Bing で一番困るのが地図関係だ。というのもやはり Google の Street View は素晴らしく、どうしても世話になる場面が多い。Google で検索すれば GSV も一緒に検索出来るのだが、Bing だと航空写真までが精一杯。こと地図周りに関しては Google の方が一歩どころが、1000 歩以上ぬきんでていると思う。いわゆる越えられない壁というヤツだ。
そんなわけで、最近はデフォルトの検索エンジンをやっぱり Google にしようかなぁなんて思い始めている。ちなみにうちのサイトに飛んでくるのに使われている検索エンジンは 80% が Google。次点が Yahoo なんだけど日本の Yahoo は Google をつかっているので、実質 93% が Google だったりする。そしてこの分布は、うちのブランドのサイトもそうなので日本ではいかに Google が強いかよく解る。
なので Bing を使い続けたいんだけどねー、Google Street View も一緒に検索出来ないのはつらいなぁ……。

ミラーの力

エロゲには「ミラーサーバ」という文化がある。誰が始めたのか知らないが、体験版やムービーなどの大きなデータは公開時にアクセスが集中すると回線がパンクし、誰も落とせないような状態になってしまう。その転送量は凄まじいもので、1 日で 1000 GB近くにもなる。普通のプロバイダだったら帯域制限どころか、契約を切られてしまうところだ。
そこでそれらを支援しようと、エロゲの体験版などを置いてくれる人たちがいる。これは公式でも何でもなく、有志の人たちで成り立っている(ボクの知る限りでは、だが。どこか流通やメーカーから支援を受けている人もいるかもしれない)。エロゲ・メーカーによっては、自分のサイトには一切置かず、このミラーサーバのみに頼っている所もある。

個人的にはこのミラーサーバに頼るというのが未だに解せない。最も体験版などは公開されているものだから、それを転載するなと言うのは無理な話だし、そもそも広報活動の一環であるから、転載はむしろ歓迎である。ただ、そのミラーサーバに置かれているデータが果たして本物かどうかは、ボク(サイト運営者)は保証出来ない(本家がハッシュなどを公開していれば、改竄されているかどうか解りやすいが)。

今のエロゲ・メーカーは体験版などを公開するとき、これらミラー・サーバをとりまとめてくれる人に連絡を取り、先にデータを渡しておく。そしてしかるべき公開日に公式と合わせてミラーも公開してもらうと言う方法をとっている。
一方ボクは、ミラーさんにはお構いなく、公式で公開してしまう。ミラーはミラーで好きに転載すれば良いというスタンスを取っている。ただそれをやると、公開直後はアクセスが集中し、ミラーさん自身がデータをとれないことがあるため、最近では開発用の回線(こちらの回線はまったく別なのでサイトにお客さんが集中しても影響しない)にミラーさん向けのデータを置き、ミラーさんにはそちらからダウンロードしてもらうようにしている。

話はそれるが、現在ボクが管理しているメーカーのサイトは公式サイトとは別に転送量無制限のダウンロード専用サーバを用意している(関連記事)。かつては、自社で契約しているプロバイダを利用していた。固定 IP を契約して、サーバを立て、メーカーのサイトもダウンロードもそして開発も全部一つの回線だった。ところがコレをやると体験版が公開されたときに回線がまったく使い物にならなくなり、開発にも影響が出るだけでなく、プロバイダからきついお叱りを受ける。
ただし、OCN の法人サービスだけはこれに耐えた(OCN の法人コースは転送量無制限)。

閑話休題。
で、5 月に体験版第一弾をリリースしたのだが、ほぼ二日間、契約帯域である 100Mbps をすべて使い切っていた。訪問者数は初日が 1 万人、二日目が 8,000 人であった。出来たばかりのブランドで、一日平均 2,000 人しか来ていないサイトだったのだが、体験版が出たとたん、5 倍の訪問者数となった(この訪問者数というのはユニーク IP の数である。また、バナー表示のみの IP 含まれていない)。
そしてこのアクセス数の増加は、ミラーサイトでこちらの体験版が転載されてからのことであった。つまり、1 日 2,000 人程度のサイトに、ミラーに体験版が乗ったことで 10,000 人になったワケである。もちろんずっと 1 万人来るわけではない。なんだかんだで、三日目には半分以下の 4,000 人に、四日目は3,000 人と落ち、なんだかんだで 1 週間後に訪問者数は安定してしまった。ただ、安定した数字が 2,500 前後となり、体験版公開前より 500 人ほど増えた。この 500 という数字はおそらくミラーサイトによってうちのブランドを知って、そして気になってくれた人たちなのであろう。

なるほど、どうして他のエロゲ・メーカーはミラー・サイトと協調して体験版を公開するのかようやく解った。ミラー・サイトはそれだけ客を呼び込む力があるわけだ。これは即ち、メーカーのサイトに見に来て情報収集しているわけでなく、単純にミラー・サイトをチェックしているユーザが多いと言うことなのだろう。
そして新たな疑問も湧く。それってつまり、体験版にしか興味がないというと言い過ぎなのだろうが、体験版が出るまでメーカの情報を拾わないユーザがかなりいるのではないだろうかと言うことだ。
うちのサイトの場合、少なくとも体験版後に増えた 500 IP に関しては今まで取りこぼしていたお客さんと言うことになる。これは 500 人とは限らない。毎日来ている人はそんなにいないだろうし、時々来る人もいるってことを考えると、500 人以上増えているのではないかと予想している。

いやー、ミラーの力は凄いなぁ。
けれどやはりこのミラーの文化には違和感をおぼえる。今後はこの取りこぼしていた人たちにいかにして情報を伝えるかが重要になってくるような気がしている。とはいえ、体験版をチェックしている人たちだろうから、体験版でしか釣れないような気もしている。
例えば 1 シーンだけをピックアップしたタイニー体験版みたいなのをたくさん作ったら、彼らは来てくれるんだろうか?
そして気になるのが、実は体験版だけでヌければそれでいいやっていうユーザもいるんじゃないだろうかとも思っている(それはユーザと呼んでいいか迷うがw)。
今後もサーバのログとにらめっこしつつ、いろいろと考えてみたいと思う。
そんなエロゲ・サイト管理者の感想でした。

 

video タグを使う

ブランドの Youtube のアカウントが、BAN さてたことは以前に書いたが、その後、ずっとブランドの動画公開ページは、ストリーミング再生が出来ない状態が続いていた。
さてどうしようか。
最初  Flash でストリーミングするものを作ってみたのだが、どうも勝手に再生されてしまう。 いろいろとネットを徘徊して、自動再生を OFF にする方法をみつけたのでそれを設定してみたんだが、やはり勝手に再生されてしまう。うーん、こまった、どうしようかなと思って最終手段を使うことにした。
それは HTML5 で規定された video タグである。ただこれを使うと、IE は 10 以降じゃないと再生されない(と思う)。Chrome や Firefox はそもそも勝手に最新になるので、気にすることはないだろう。 というわけで、このサイトでも貼ってみた(ぁ

ただよく解らないのが、WordPress で video タグを使うと、勝手に Flash のコードが挿入されちゃうのよね。なんだこれ?? 仕方がないので、HTML を直書きして公開(保存)ボタンを押している。勝手なことするなっちゅーの!
で、video タグ。上のデータは MP4(中身は h264)と webm の二種類を指定してある。Firefox や Google Chrome は webm を見に行くはず。そして IE10 だと MP4 を読みに行く。
コーデックの他に違いがあって、MP4 は 560×312 ドットに対し、webm はそのまんま 1280×720 ドットになってしまっている。これは webm の無料のコンバータがリサイズに対応しておらず、ソースをそのままコンバートすることしか出来ないからだ。わざわざリサイズのデータを作ってからそれを webm のコンバータに流すのもめんどくさいなぁと。だって、可逆データなんだもん。14GB くらいあるんですぜ。

で、他にも試してみたのが、背景の動画再生。 これがけっこう簡単にできてしまった。古いマシンだと重いけど(ぁ。ただ z-index 必須だなぁ。今回のサイトは z-index はまったく指定していないので、ボタン類だけが表に来てあとはみんな後ろに行ってしまった。

それにしても HTML5 は色々と便利だね。確かに少しの手間でけっこう手の込んだことができるようになっている。ちょっと前に嘆いていた更新もだいぶ片手間にできるようになって来たし……慣れって恐ろしいなぁ。