2013年2月アーカイブ

2月22日

| コメント(0) | トラックバック(0)
昨日はOB,OGの先輩方と飲みました\(^o^)/
とっても楽しかったです。
ベガルタ・楽天・89も楽しみですね(・ω<)


前回Thunderbirdに作成したDraftsのフォルダに
問題発言をツイートに似た感じに編集してコピペするという作業をしました。
次に、Draftsから受信トレイに移動させて、迷惑マークをつけました。
(gmailが攻撃されていると勘違いされないように、10〜15通程度を30分おきに)

学習の経過。
「リスカ」「リストカット」「死にたい」ワードは完全に学習が進んでいる様子。
嗜好品の学習もok。
中傷発言は、今回の問題発言を学習させてしっかり学習されるか。

よくよく考えれば
Mbox形式のこの方法を使えば、好きなワードをメールにすることができるので
学習させたいワードを簡単に学習させることができますね。

今まで作成してきた環境をもう一度見なおして、改善点や追加する機能をまとめてみるのが今週の課題かなと思います。
(ツイートがうまく抽出できていないところがある...??ちょっと改善の余地あり。)

2月15日

| コメント(0) | トラックバック(0)
おはようございます(´・ω・`)
今日のゼミは10時からです。
朝早いのもいいですね(・ω<)

Mbox形式というものを勉強しました。
電子メールの保存フォーマットで,すべてのメールが1つのファイルに保存されます。
Fromで区切られます。


まず,ネット巡視員が見つけてきた大量の問題発言をcsv形式(カンマ区切り)で保存します。
そのファイルを読み込み,一覧にメールの形にするスクリプトのサンプルを先生にもらいました。
それをMbox形式でThunderbirdにインポートさせればokじゃんという話でした。
あとは同じように学習させるだけ。

最初,txt形式で保存されているファイルをMbox形式に変換しなくちゃいけないのかと思ってどうするのかいろいろ調べてました←w
最終的にWindowsまで立ち上げるというw←Win専用のアプリだった

そしたらただ単に,Thunderbirdのローカルフォルダにフォルダを作って,そこに作ったメールをコピペすればいい話だった!!
「ライブラリ」→「Thunderbird」→「Profiles」→「Mail」→「Local Folders」の中に作ったフォルダ(今回は「Drafts」)が書類形式で入っているので
そこにコピペすればよいといった感じでした(´・ω・`)
なんと!!w簡単っ!!
勉強になりました\(^o^)/

もう少し頑張ります!!



2月8日

| コメント(0) | トラックバック(0)
昨日は卒業研究発表会でした。
就活の説明会があったので,安藤研と鵜川研の発表しか見れなかったのですが
みんなの発表を生で見れて良かったです。
(3年生はビデオで見ます\(^o^)/)
1番最初の頃と比べると,ずいぶん良くなった発表でした!!
ちかちゃんの発表に関しては,ガチで泣きましたw
本当にお疲れ様でした。

問題の自分の研究ですが。。。
CSV形式からメール化するのがうまくできませんでしたー
スクリプトをもう少し直す必要があるようです。
まずは自分でやってみる努力をして,分からないところは先生に助けてもらおうと思います。

今週は,
「リスカ」「リストカット」「死にたい」などの自殺行為の言葉を特に抽出してきました。
何回か抽出し学習させて,うまいこといっています。
この調子でいけるなら,もう少し使いやすいメール画面に改善したいと思います。

2月1日

| コメント(0) | トラックバック(0)
こんにちは(´・ω・`)
辛かった授業もやっと今日で終わってやっほーい\(^o^)/な松田です。
春休みに入るので,学会終わって緩んでいた分進めて行きたいと思います。

Thunderbirdの機能を確立を(本当に確立可能なのか),判断する必要がありました。
問題発言を判断する程度は高まっていると感じています。
ただ,実際の仙台市内の児童生徒のネット書き込みを読んでみて,もう少し深める必要性があると考えました。

①法律違反の書き込み
 「◯◯盗んだ」といった発言。
  嗜好についての発言。銘柄で表現する傾向がある。
  飲酒発言。お店の名前がよく出てくる。
②自殺予告の書き込み
 こちらに関しては,ほとんどノータッチだったため対応する必要がある。
 「死にたい」や「リスカ」など。
 実際,「リスカ」のワードが入った自殺書き込みのツイートが抽出されたので,しっかり学習させておきたい。

この2点に関しては,もう少し対応していきたいと考えています。
現在は,先生からもらった児童生徒のネット書き込み情報をHTMLで抽出しています。
あとは同じようにメールにしてThunderbirdに学習させていきます。

どんどん学習させていけたらと思います。

このアーカイブについて

このページには、2013年2月に書かれたブログ記事が新しい順に公開されています。

前のアーカイブは2013年1月です。

次のアーカイブは2013年3月です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。

ウェブページ

Powered by Movable Type 5.12