スキップしてメイン コンテンツに移動

第12回北海道開発オフに参加した

今日は第12回北海道開発オフでした。

開発オフはいつも通り、勉強会というよりはサークルのようなものなので、やってる事はいつも通り「各個人が黙々と開発して、ランチして、成果発表する」なのですが、今回はなんと過去最多の20人の参加!すごい!人が増えてもやることは変わりませんけど(笑)でもこの「もくもくやる」という事の楽しさが、少しでも多くの人に伝わってきたのかなぁ、なんて思います。

さて、今日の僕の成果ですが、しばらく中途半端になっていた、我が愚息@dabesaの教育です。結構作り込みを変えたのですが、大きくは以下のような構造をしています。

---
・Twitter絡みの部分は全てTwitter4Rを使用。
@smokeymonkeyのFriend Timelineから最新200ポストを取得。
・元となるデータファイルに、最新200ポストをマージ。このデータファイルは常に新しいほうから5000個のポストを保持。
・5000個のポストをMeCabで形態素解析して、マルコフテーブルを生成。このとき、各ポストの一番最初の単語にフラグをつけておく。
・フラグをつけられた「各ポストの一番最初の単語」をランダムに抽出し、そこから文章を生成。
・生成された文章のうち、一部を北海道弁に置換。
・Twitterにポスト。
・Replyは、Replyでもらったポストから名詞・動詞を抽出し、その単語を元に文章を生成して返す。ただし文章を生成出来なかった場合は複数パターンの応答を返す。
・一日2回(9時・21時)、Google TrendsからHottrendキーワードをポストする。
---

ソース自体は素人の日曜大工なので腐ってるのですが、まぁ以前よりはちゃんと日本語っぽい言葉を発することが出来てるんじゃないかな、と思います。今後も改善していきたいですね。

Ruby 逆引きレシピ すぐに美味しいサンプル&テクニック 232 (PROGRAMMER’S RECIPE)
島田 浩二 設樂 洋爾 村田 賢太 前田 智樹 谷口 文威
翔泳社
売り上げランキング: 168012

人様にさらせるほど立派なものでは無いですが、一応ソースは以下に。



#! /usr/bin/ruby -Ku

require 'rubygems'
gem 'twitter4r'
require 'time'
require 'twitter'
require 'pit'

require 'MeCab'
require 'kconv'

require 'uri'
require 'net/http'
require 'rexml/document'

require 'cgi'
class Hash
  def to_http_str
    self.map{|key,value| "#{key}=#{CGI.escape(value.to_s)}"}.join("&")
  end
end

# ************************************************
# データを取得するところ
# ************************************************
def getData
  data = Array.new
  fdata = Array.new
  ndata = Array.new

  # smokeymonkeyのアカウントを使う
  config = Pit.get("Twitter")
  cl = Twitter::Client.new(config)

  # 元となるデータを取得
  timeline = cl.timeline_for(:friend, :count=>200) do |status|
    post = Kconv.kconv("#{status.text}",Kconv::UTF8)
    if /[!-~]/ !~ post then
      data.push(post)
    end
  end

  # データファイル読み込み
  f = File.open("data.txt",'r')
  fdata = f.readlines
  f.close

  # データファイルの内容に最新データを追加
  fdata.concat(data)

  # データファイルの最新5000行を取得
  i=0
  fdata.reverse_each do |post|
    ndata.unshift post
    if i > 5000 then
      break
    end
    i = i+1
  end

  # データファイルに書き込み
  f = File.open("data.txt",'a')
  f.puts ndata
  f.close

  # 分析用データを返す
  return ndata
end

# ************************************************
# マルコフしちゃうところ
# ************************************************
def makeMarkov(data)
  ary = Array.new
  tbl = Array.new

  c = MeCab::Tagger.new(ARGV.join(" "))

  # データからマルコフテーブル作成
  data.each do |line|
    line.chop!
    node = c.parseToNode(line)
    node = node.next
    i = 0
    while node do
      hash = Hash.new
      hash["0"] = i
      hash["1"] = node.surface
      node = node.next
      if node then
        hash["2"] = node.surface
      else
        hash["2"] = nil
      end
      ary.push(hash)

      # 各文章の最初の単語だけのArrayを作成
      if hash["0"] == 0 then
        tbl.push hash
      end
      i = i+1
    end
  end
  return ary,tbl
end

# ************************************************
# マルコフしちゃうところ
# ************************************************
def execMarkov(ary,tbl)
  mess = ""

  # 連鎖する
  post = tbl[rand(tbl.size)]
  mess.concat(post["1"])

  # 継続する単語が無くなるまでループ
  while post["2"] != nil do

    # 候補を抽出
    rndline = Array.new
    i = 0
    ary.each do |line|
      if post["2"] == line["1"] then
        rndline.push(line)
        i = i + 1
      end
    end

    # 候補からランダムに接続
    post = rndline[rand(i)]
    mess.concat(post["1"])

    # 候補が以下3種類だった場合はEnd
    s1 = Kconv.kconv("。",Kconv::UTF8)
    s2 = Kconv.kconv("!",Kconv::UTF8)
    s3 = Kconv.kconv("?",Kconv::UTF8)

    if post["1"] == s1 or post["1"] == s2 or post["1"] == s3 then
      post = Hash.new
    end
  end

  # ポストするメッセージを戻す
  return mess
end

# ************************************************
# 北海道弁変換するところ
# ************************************************
def subDabesa(mess)
  mess.gsub!(/すごく/,'なまら')
  mess.gsub!(/すげえ/,'なまら')
  mess.gsub!(/とても/,'なまら')
  mess.gsub!(/バカ/,'はんかくさ')
  mess.gsub!(/酷い/,'わやい')
  mess.gsub!(/ひどい/,'わやい')
  mess.gsub!(/落ち着かない/,'あずましくない')
  mess.gsub!(/交換した/,'バクった')
  mess.gsub!(/いじった/,'ちょした')
  mess.gsub!(/バイバイ/,'したっけ')
  mess.gsub!(/冷たい/,'しゃっこい')
  mess.gsub!(/疲れた/,'こわい')
  mess.gsub!(/大変だ/,'ゆるくない')
  mess.gsub!(/痒い/,'いずい')
  mess.gsub!(/ヤバイ/,'やくい')
  mess.gsub!(/ヤバい/,'やくい')
  mess.gsub!(/やばい/,'やくい')
  mess.gsub!(/格好悪い/,'がさい')
  mess.gsub!(/カッコ悪い/,'がさい')
  mess.gsub!(/頑張/,'けっぱ')
  mess.gsub!(/捨て/,'なげ')
  mess.gsub!(/本州/,'内地')
  mess.gsub!(/小さい/,'ちゃんこい')
  mess.gsub!(/ちいさい/,'ちゃんこい')
  mess.gsub!(/止めろ/,'止めれ')
  mess.gsub!(/やめろ/,'やめれ')
  mess.gsub!(/だな/,'だべな')
  mess.gsub!(/だね/,'だべね')

  return mess
end

# ************************************************
# ポストするところ
# ************************************************
def putPost(mess)
  # Twitterにポスト
  config = Pit.get("dabesa")
  cl = Twitter::Client.new(config)
  cl.status(:post,mess)

  # Wassrにポスト
  wmess = 'status=' + URI.escape(mess)
  req = Net::HTTP::Post.new("/statuses/update.json?")
  req.basic_auth(config["login"],config["password"])
  Net::HTTP.start('api.wassr.jp',80) {|http|
    response = http.request(req,wmess)
  }
end

# ************************************************
# RepliesからReplyを返信する
# ************************************************
def SendReplies(ary,tbl)
  data = Array.new

  c = MeCab::Tagger.new(ARGV.join(" "))

  config = Pit.get("dabesa")
  cl = Twitter::Client.new(config)

  flg = 0
  sid = nil

  idfile = open("repid.txt",'r')
  idfile.each do |id| sid = id.chop end
  idfile.close

  # Twitterのreplies APIを取得
  req = Net::HTTP::Get.new("/statuses/replies.xml")
  req.basic_auth(config["login"],config["password"])
  xml = Net::HTTP.start('twitter.com',80) {|http|
    http.request(req).body
  }

  # API(XML)を解析しstatusがある間ループ
  doc=nil
  doc=REXML::Document.new xml
  doc.elements.each('/statuses/status') do |elm|
    scname = elm.elements['user/screen_name'].text.to_s
    # dabesa自身のポストなら無視
    if scname == "dabesa" then next end

    # 最新Replyのidをファイルに書き込み
    if flg == 0 and elm.elements['id'].text.to_i >= sid.to_i then
      idfile = open("repid.txt",'w')
      idfile.puts elm.elements['id'].text.to_i
      idfile.close
      flg = 1
    end

    # 取得していた最新Replyまで到達したらBreak(既にRelyしたポストは無視)
    if elm.elements['id'].text.to_i <= sid.to_i then
      break
    end

    #Replyのテキストを取得し、名詞と動詞を探す
    post = elm.elements['text'].text
    # 半角全角を削除
    while /^\.*\/*@[A-Za-z0-9_]*/ =~ post do
      post.sub!(/^\.*\/*@[A-Za-z0-9_]*/,'')
      post.sub!(/\s*/,'')
    end
    post.chop!
    n = c.parseToNode(post)
    n = n.next

    word = Array.new
    while n do
      ftr = n.feature.split(",")
      if ftr[0] == "名詞" or ftr[0] == "動詞" then
        word.push n.surface
      end
      n = n.next
    end

    # Replyの名詞or動詞がマルコフテーブルにあればそこから文章を作る。
    # マルコフテーブルに無ければ疑問を返す。
    wflg = 0
    ary.each do |line|
      if word[0] == line["1"] then
        post = line
        wflg = 1
      end
    end

    mess = String.new
    if wflg == 1 then
      mess.concat(post["1"])
    else
      mflg = rand(10)
      case mflg
      when 0,5,10
        mess = word[0].to_s + "ってなんだべか。"
      when 1,3
        mess = word[0].to_s + word[0].to_s + "はんかくさい。"
      when 2,6
        mess = "そったら" + word[0].to_s + "とか興味無いし。"
      when 4,7,8,9
        post = tbl[rand(tbl.size)]
        mess.concat(post["1"])
      end
      post = Hash.new
    end

    # 継続する単語が無くなるまでループ
    while post["2"] != nil do

      # 候補を抽出
      rndline = Array.new
      i = 0
      ary.each do |line|
        if post["2"] == line["1"] then
          rndline.push(line)
          i = i + 1
        end
      end

      # 候補からランダムに接続
      post = rndline[rand(i)]
      mess.concat(post["1"])

      # 候補が以下3種類だった場合はEnd
      s1 = Kconv.kconv("。",Kconv::UTF8)
      s2 = Kconv.kconv("!",Kconv::UTF8)
      s3 = Kconv.kconv("?",Kconv::UTF8)

      if post["1"] == s1 or post["1"] == s2 or post["1"] == s3 then
        post = Hash.new
      end

    end
    pmess = "@" + scname + " " + mess
    cl.status(:post,pmess)
  end
end

# 実行部
data = Array.new
ary = Array.new
tbl = Array.new

data = getData()
ary,tbl = makeMarkov(data)
mess = execMarkov(ary,tbl)
pmess = subDabesa(mess)
putPost(pmess)

SendReplies(ary,tbl)

exit

コメント

このブログの人気の投稿

これで完璧!本当に役立つテレワークマナー

コロナ禍によってテレワークを導入する企業が増えた昨今、皆様いかがお過ごしでしょうか。僕は4連休明けでダルかったので有給を取得し妻とデートしてきました。イェーイ。 さて、 弊社 も今年2月以降は全社員完全テレワークに移行しました。弊社は2011年からテレワークを導入し各自が自由に活用していたため、特に大きな問題も無くテレワーク体制に移行したのですが、全社員完全テレワークは初めての状況であり、幾つかの課題が発生しました。特に、その状況下でも新しく入社する社員がいますので、これまで社内で培ってきた暗黙の了解が共有出来ないことは大きな課題でした。 ということで、本記事では、弊社のテレワークマナーについてご紹介したいと思います。皆さんのご参考になれば幸いです。 業務の開始と終了はチャットで宣言する これはオフィス出社時でもテレワークでも変わらないのですが、業務開始時と業務終了時にはSlackで宣言しています。弊社ではこれを開店/閉店と呼んでいます。 気をつけて頂きたいのは、これは 報告ではなく共有である ということです。業務開始と業務終了を共有しておくことで、同僚が相談したり依頼をしたりできる時間を把握出来ます。この共有をしておかないと、業務開始前や業務終了後にMentionがバンバン飛んで来るかもしれません。もちろん飛んできたからって怒るメンバーはいないのですが、お互いちょっとした気遣いが出来るように、自分が働いている時間は共有しておくと良いでしょう。 これは休憩時間も同様です。昼休みにのんびりゲームしているときにスマホがブーブー鳴っていたら気が散るかもしれません。休憩開始と終了をSlackで宣言することでゆっくり休憩することが出来ます。休憩中は Display name の後ろに「休憩中」等と付けておくのも良いでしょう。 マイクとスピーカーはPC内蔵のものを使わない PCの性能は以前と比べて格段に上がっていますが、残念ながらマイクとスピーカーはそうではありません。マイクについては音質は向上しているものの、指向性が無いために周囲の音を拾ってしまいます。そしてPC操作時には、どうしても打鍵音がダイレクトに響いてしまいます。またスピーカーは、まぁ正直全く駄目です。音楽を聞くのにさえ向いていないのに、音声のやり取りなんか出来るわけがない。 マイクとスピーカーは必ず別に用意しましょ

「許可を得るな、謝罪せよ」が意図していること

 弊社ではセルフマネジメントとアウトプットファーストを行動指針として掲げていますが、セルフマネジメントを象徴する言葉としてよく使われるのが 「許可を得るな、謝罪せよ」 です。 細かい話は 以前ブログにした のでそちらを読んで頂くとして、この言葉が意味するのは「アクションするのにいちいち許可を得る必要はない。許可を取る時間が無駄。やっていいですかじゃなくてやりましたと言えばいい。その結果間違っていれば謝れば良いだけ」です。 何故この方針を取るのか、この方針によってどのような結果を期待しているのか、を改めて整理したいと思います。 アクションのスピードを上げたい これは上述した意味の通りで、何らかの施策や企画があるときに、上長の許可を取るために資料を作ったり、打ち合わせしたり、下調べをしたり、という時間が無駄だからです。 この考え方の前提として「小さな失敗を早くたくさんする」というのがあります。どんな施策も企画も、正解なんて誰にもわからないし、やり方次第で変わるものです。アイデアの時点であーだこーだ言うより、実際に手を動かしてやってみて、その結果から継続の判断を行うことで、リスクを小さく、コストも小さく、たくさんアクションすることが出来ます。 モチベーションを持って取り組んでもらいたい 何でもそうですけど、人に言われたことをそのままやるより、自分で考えたことを自分のやり方でやるほうが、面白いです。僕が仕事をする上で、または僕がピープルマネジメントする上で、一番重要視しているのは、面白いかどうか、です。 担当者がモチベーションのないままやって成功することなんて(ほとんど)ありません。その施策や企画の実施に一番モチベーションがあるのはそれを考えた人なので、その人に主導してもらうのが一番成功率が高いです。 主体性を持って取り組んでもらいたい モチベーションと同様に、担当者が主体性のないままやって成功することなんて(ほとんど)ありません。その施策/企画を自分ごととして捉え、だからこそ知恵を絞って、全力を発揮する、つまり主体性を持って取り組むことが、一番成功率が高いです。そしてもちろん、一番主体性を持てるのはそれを考えた人です。 なお、主体性と責任は違います。前述の通り「小さな失敗を早くたくさんする」ためには、失敗に対して責任を追求するのではなく、結果と知見を追求する、という文化が

組織を構成するビルダー、フォロワー、ワーカーについて

僕の経験上、新しい事業体を立ち上げたときの組織構成は大きく3つに分かれる。というか3つのタイプを必要とする。なお、ここではそもそもパフォーマンスが出ない人を含めていない。 その事業を成功させることに高いモチベーションがあり、その結果の責任も積極的に取るタイプ。会社の創業者とか新部門の責任者とか、立ち上げメンバーがコレに当たる。 もともとはその事業に対して特にモチベーションが無いんだけど、事業を担当することによって深くコミットし、結果としてモチベーションが高くなるタイプ。 事業に対するモチベーションが無いからコミットもしないんだけど、担当する業務はしっかりとこなすタイプ。 1をビルダー、2をフォロワー、3をワーカーとこの記事では呼称する。 事業が立ち上がったばかりの組織構成として、ビルダーは当然少ない。可能な限りフォロワーを増やすことを僕はお薦めする。事業のスタート時期というのは不足していたりそもそも無かったりすることがたくさんあり、それらをプロアクティブに拾い続けて解決するためにはモチベーションが必要だからだ。この時期の組織では、業務に対して合うスキルセットの人を採用する(=ワーカー)より、企業理念や事業ビジョンにコミットしてくれる人(フォロワー)を採用したほうがスピードが上がる。ワーカーがあまりに多いと作業指示が無いゆえの作業待ちが発生し、スピードが上がらない。比率的には1:6:3くらい。 事業がある程度立ち上がって順調に拡大するフェーズになると、今度はフォロワーをどうやってビルダーに成長させるか、ワーカーをどうやってフォロワーに成長させるか、が課題になる。このくらいのフェーズではマネジメント教育とかコーチング研修なんかが必要になる。企業理念や事業ビジョンを更に明確にし、言い続け、常に意識させる作業が必要になる。 そして、ある程度事業の形が出来てくると、ふわふわした仕事が少なくなるので、ワーカーを業務に対してアサインしやすくなる。こうなると2:4:4くらいの比率でも上手くいく。それでもワーカーを過半数以上にするのは僕はおすすめしない。事業にコミットしない人が増えると組織全体が「コミットしないのが当たり前」「コミットしない人が評価されて不公平」みたいな空気感が生まれちゃうことが多い。なので過半数以上は事業にコミットする人で固めたほうが良い。 つまり、組織の責任者は「