ceekzさん講演会
有限会社てっくてっく
1984年生(25歳)
2003年 情報学類入学
2005年 留年(2年生2回目) ー 年度末に起業 -> 2年生3回目
2009年 システム情報工学研究科 入学 - 研究漬け
2011年 進学できたらいいな
自然言語処理
てっくてっく 代表取締役
----------------------------------------------------------
Web検索エンジン
こういうことになるといいなー
・おもしろい研究テーマが思いつくと、やらない?って振ってみる。
拡大するウェブ
・大量のウェブ
-2600万 unique URLs (1998)
-1兆ページ
必要な情報を得る為に 93.7%
主要なウェブ検索エンジン
- Yahoo! - Google - Bing
ー日本語を使うのに、海外のサービスにやられてしまう? 参入障壁高いはずなのに...
日本発 mooter? 検索エンジンは儲からない?
ディレクトリ型(サービスの形の名前)・フルテキスト型 ×ロボット型
4つの軸
人力
ディレクトリ型 フルテキスト
ロボット
ディレクトリ型のロボットで集めるタイプがまだない?
-> ニュースを集めるサイトとして、topics.net がかつてあった?
ーはてなブックーマークなど、ロボットの代わりに、集合知が代用?
階層に分けるには、高度な知識が必要だから、現状では難しい? 意味解析にも関わる。
-> 実用化も難しいかもだけど、ビジネスにならない!
インデックスは他の人に任せて、クローラをどんどん書いて行っている。
○派閥は3つある?研究の NLP / データベース/人工知能 <- 人が交わらないよ!
●未来の検索エンジンのはなし
*キーワード検索の限界
ー>内容との乖離 犬というテキストとネコの写真
ー>概念で検索 ー「元気の出るウェブページを見たい」
人間の生体情報を使った検索ができるんじゃないの? @ceekzさん予想
*ページ単位の限界
マイクロブログの普及 − ショート・コンテンツ (前後の文脈が分からない?)
●大量の検索結果を全部みる? - 平均 2.35 (米国 1999)
●ランキングアルゴリズム − ベクタスペースモデル、PageRank
●新しいコンテンツ ーブログ,ニュース, ショッピング
ー>社会にインパクトを与えられても、学会に与えられないかも。逆もしかり。 どちらを取るか、どちらも取るか。
ブログ検索はまだ使われていないけど、需要が増えているはず。
提示方法とランキングアルゴリズムが今後重要に!
革新的web検索を作ると、ページビューが落ちて、広告料へるかも。でも、新しいのを作りたいですね!
*検索結果の提示方法
●電話帳メタファからの脱却
− Blogopolis
ー http://blogopolis.jp/
------------------
CEEK.JP 統合型検索エンジン
ー統合型メタサーチエンジン 2002年8月開始
●当時のウェブ検索エンジン
ー定番がない状態
ー複数の検索エンジンを使い分ける
●CEEK.JPのねらい
作業の自動化
1. ユーザがキーワードを入力
2.CEEK.JPが複数の検索エンジンで検索
3. 検索結果を統合して表示 (時間がかるかも)
メールアドレスなどの、Googleに引っかかりにくいものを探す時に今使っている。
-----------------
CEEK.JP NEWS
- ロボット型ニュース検索エンジン
- 2004年6月開始(β版:2003年11月)
- 日本語では最も歴史がある
●初期(2003年2月)
- CEEK.JPと同じ仕組みで
●ニュースソースの少なさ
●反映の遅さ
●権利問題
ー>クローラが6年ずっと動いている。 perlで2000行 スパゲッティコード もう触りたくない
●需要の予想
- 海外でBlogがブームに
- ニュース検索の需要が伸びると予想
- 狭義のBlog (Wikipedia)
●ウェブページのURLとともに覚え書き
一から検索エンジンを作りたかった!
●サーバを準備しないと!
自前でサーバを構築しよう!
暖房要らない 40-50度のときが壊れにくい
ハードウェアの自由度が高い
●前述のロボット型検索エンジンと同様
●サービス理念
ーシステムは情報の取捨選択はしない(表示順序は日付順)
ー機械化が進むと人間は馬鹿になる(と僕は信じている)
●検索エンジンンのパワー
ー興味が分かる ー未来の予測
官公庁、国が検索したキーワードがわかる!? ライバル会社も!
生データを持てるので、強くなった気がする!?
●今後の展望
−対象サイトの増強
ーバックエンドシステムの変更(ファセット検索の実現)
MySQL => Apache Solr
-有料検索サービスの提供 解析結果の提供 APIの提供
-未来年表の自動作成
-----------------------
有限会社てっくてっく
ー2006年3月 設立 変な会社名
目的
ー学生に適切な報酬を ーサービス運用の法的リスク軽減 ー新しい働き方を目指して
●有限会社 ー決算の公開義務ない
●学生に適切な報酬を ー学生の技術力は低いか? ー受注金額の50%を報酬に(ただし、継続雇用を保障しない)
●失敗・・・
ー高い報酬を避ける(責任回避?) ー自己マネンジメントを行わない ●安定雇用を臨む
●サービス運用の法的リスク軽減
ー 個人:無限責任/法人:有限責任
●(旧)著作権法
ー>ウェブ検索エンジンの法的リスク
・クローリング(複製権)・インデキシング(翻案件、同一性保持権)
ー黙示の許諾論
回避手段をとらない場合は認めると見なす
●(改正)著作権法(2010年1月)
ーウェブ検索エンジンの例外追加
●ライントビックス事件(平成17年)
ー読売新聞が記事見出しの無断複製により著作権を侵害されたと提訴
ー知財交際は記事見出しの著作権を認めなかったものの、不法行為を認め賠償命令
研究データも会社のほうに、データを移して管理している。
●ビジネスモデル
ー受託開発
・運営サイトを見た会社が依頼 ・ウェブサービス全般
ー保守業務
・会社運営
-------
キャリアを考える ※一例です。自身のキャリアは自己責任です。
●ソフトウェア検索エンジン(K-Search) 200r年 高校1年
●無料Webスペースの提供 2001年
●CEEK.jP 2002年
●フリーランスで活動開始 2003年 大学1年
●凄く儲かった 2005年 kakaku.comの類似サイト
●会社創業(2006年) 池嶋さん(Google)と創業
●受託開発の方向性
ーウェブとネイティブソフトのハイブリッド
ー両方出来る会社はそんなに無い -> ONPOO.net exciteで今、動いているみたい。
暗号を他の方に任せた。
●どのように仕事をしたいか?
年功序列制 から お金いっぱいにならなくてもいいから、勤務時間を4-5hに減らしたいなー。
●通常の給与モデル
ー勤務時間は一定で給与が上がる ー勤務時間に選択肢がほぼない
●起業しかない?
●5年で●億貯める!! ー身体壊しそう・・・(かつてのベンチャー企業)
●ほどよくほどよく
ー保守業務 年間保守料の目安:受託金額の30% 品質の高いソフトウェアを提供
ーウェブサービスの提供 課金、広告収入
●お金はあまり使わない ー食事ー図書ーサーバ 本は月1-2万
●大学院生なのでけんきゅうします
●研究と仕事は両輪でありたい
ー仕事上の課題を研究で解決する
ー学術界との課題にズレがでるが... ●工学のゴールはビジネスなのでは?
●Webコンテンツの抽出
ーニュースの抽出
やりすぎ注意
・2009年度の対外発表 論文誌1件、口頭5件、ポスター4件
●やりたいことと違うような...
ー本当にやりたいこととは?ユーザにプロダクトを使ってもらいたい!
ウェブサービスの開発
●手軽に開発/手軽に利用
ネイティブアプリにはダウンロードの障壁
●上流から下流まで
アイデア、設計、開発、宣伝、運用・・・
手応えを感じることが出来る
難しいのは「継続」すること
ーサービスの開発は比較的簡単 継続が難しい
●継続を用意する2点
ー自身が使うこと
ーメンテンス/フリーであること
●継続することは自身の名を売ること
ー静岡大学の●●です 以外に言えますか?
続けて行けば誰かの記憶に引っかかる 継続は信用の元
その結果
お仕事が期待r、インタビューされたり、講演依頼が来たり、自信がついたり
●在学中に起業するのがおすすめ
ー卒業後も継続できそう 続ける
ー失敗した! 就職
●経験の落とし穴 ー社長の経験は社長でしかつめない ー経験・知識にゴールはない!!
●IT起業であればお手軽
*何かサービスを作りましょう
ー紹介するものがなければ営業も難しい
ー受動的な営業を目指す
*自身の能力を知りましょう 予定時間と作業時間の記録
*安売りを辞めましょう 一度下げた受託金額を上げるのは困難
*売り切りにならないように ー保守契約、再利用
おわりに
●学生の特権
ー失敗した際のリカバリが容易
ー自身のブランドを持ってみませんか?
●便利な世の中
ーIT起業であれば準備要らず
ーウェブサービスで多人数にリーチ
●一歩踏み出した先に
ーワクワクする未来があるはず
-----------
質問
納期とテストって被るよね。