Twitter APIの仕様変更のため、「いいね」の新規取得を終了いたしました

しんめたる

@sinmetal

Favolog ホーム » @sinmetal » 2014年05月08日
並び順 : 新→古 | 古→新

2014年05月08日(木)

Ikeda Daigo @hogedigo

14年5月8日

@a_know bigqueryのstreaming insertなかなかイイですよ!(^^)

タグ:

posted at 09:46:47

a-know | Daisuke Ino @a_know

14年5月8日

@hogedigo おお。ちょうどぼくもいまBigQueryを触っているところではあるのですが...取りこぼしとかは大丈夫そうです?

タグ:

posted at 09:47:25

Ikeda Daigo @hogedigo

14年5月8日

@a_know 1週間くらい動かしてデータ比較したカンジでは問題なさそうでしたが、厳密なデータにはdatastoreの方がいいかもしれませんね。streaming insertがどうというより、bigqueryにしかデータがないのがちょっと不安・・・

タグ:

posted at 09:52:28

a-know | Daisuke Ino @a_know

14年5月8日

@hogedigo データ比較もされてるんですね、結構大丈夫そう...^^ でもまぁたしかに、「BigQueryにしかない」というのはスースーしますねw

タグ:

posted at 09:54:14

Ikeda Daigo @hogedigo

14年5月8日

@a_know あと、データ重複はありえるとドキュメントにも書かれているので、レコードにID振ってgroup byかdistinctする必要あるかも。検証した限りでは重複は出ませんでしたが。。

タグ:

posted at 09:57:54

a-know | Daisuke Ino @a_know

14年5月8日

@hogedigo BigQueryだとどんどん追加ロードできますもんねぇ。たしかに、ユニークなカラムを用意しておいて、デフォルトでdistinctするようにしておいたほうがよさそうですね。

タグ:

posted at 09:59:45

Ikeda Daigo @hogedigo

14年5月8日

@a_know 一応insertId指定しておくと1分間は重複排除してくれるらしいです。

タグ:

posted at 10:00:43

a-know | Daisuke Ino @a_know

14年5月8日

@hogedigo そんな仕組みがあるんですかww insertIdってのは、streaming insert の際に一緒に指定できるパラメータ的な?(それともそういう名前でカラムを持たせておく?)

タグ:

posted at 10:01:57

Ikeda Daigo @hogedigo

14年5月8日

@a_know 1行に対してsetInsertIdできるので、レコードのkeyでも指定しておけばよいかと。

タグ:

posted at 10:18:17

a-know | Daisuke Ino @a_know

14年5月8日

@hogedigo なるほど、「このカラムをinsertIdに」みたいな指定ができるのですね^^

タグ:

posted at 10:20:33

Ikeda Daigo @hogedigo

14年5月8日

@a_know insertId自体は文字列何でも指定出来ます。bigqueryはおそらくそれを1分間キャッシュしていて、同じinsertIdが来たら追加しない、てなことをやってるのではないかと想像します。

タグ:

posted at 10:25:07

@sinmetalホーム
スポンサーリンク
▲ページの先頭に戻る
ツイート  タグ  ユーザー

User

» More...

Tag

» More...

Recent

Archive

» More...

タグの編集

gcpja gaeja gocon golang gcpug bq_sushi FateGO slim3 androidjp golangjp

※タグはスペースで区切ってください

送信中

送信に失敗しました

タグを編集しました