1
名無しさん
2023/03/16(木) 00:09:48 ID:RoG5rLml08
3/13~に限っていうと、殆どそれらしき形跡が見えない
少なくとも自作自演で盛り上げてるような形跡は全くない
引き続きポルポト政権のご支援をよろしくお願いします
10
名無しさん
2023/03/16(木) 00:16:25 ID:u6D812+408
ポル・ポトってどういうことや?統計の歴史となんか関係あるんか?
11
名無しさん
2023/03/16(木) 00:16:52 ID:RoG5rLml08主
>>2をみてみればわかるんだけど、
単発ID率と書き込み件数が逆相関なんよ
いまのところ不自然な点が全くない
12
名無しさん
2023/03/16(木) 00:17:22 ID:RoG5rLml08主
13
名無しさん
2023/03/16(木) 00:18:03 ID:uDh9nIX6dD
>>11 不思議な結果やな思ったらそういうことなんやな
14
名無しさん
2023/03/16(木) 00:19:29 ID:PvRFxT5y02
ようやっとる
15
名無しさん
2023/03/16(木) 00:20:39 ID:RoG5rLml08主
>>13 そうなんよ、時間別にみると5時台とかは書き込みが少ないから単発ID率は60パーセントを超えるくらい
16
名無しさん
2023/03/16(木) 00:20:51 ID:5RGqyZ9Q0A
それじゃあ過敏にアフィアフィ騒いで普通のニューススレを潰してる3G民が統失みたいじゃん🤣
17
名無しさん
2023/03/16(木) 00:21:06 ID:O+yYroSVS8
単発の基準が分からんからなんとも言えん部分もあるが
例えば複数書き込んでても実は似た系統のスレだったって事はあるだろうし
ただ言えば最近一番伸びたスレがバウアーで
1はいなかったが思ったよりずっと平和に進行してたしほとんどのレスは人間なんやろね
18
名無しさん
2023/03/16(木) 00:21:51 ID:u6D812+408
19
名無しさん
2023/03/16(木) 00:22:25 ID:5hdooJkz0F
明らかに煽ろうって単発は見るけどアフィっぽいのは少ないのかもね
20
名無しさん
2023/03/16(木) 00:23:46 ID:TdTvH9Y80F
欲を出せばidchangeスレを抜いた統計とかも欲しいわね
21
名無しさん
2023/03/16(木) 00:24:05 ID:RoG5rLml08主
>>17 単発ID率の基準は以下にしてる
1度しか書き込みがないID / (全体の書き込み数 - !changeidスレの書き込み数) * 100
22
名無しさん
2023/03/16(木) 00:25:02 ID:JARNgVEg03
末尾のデータとかもあるといいかも?
23
名無しさん
2023/03/16(木) 00:25:21 ID:RoG5rLml08主
>>17 なんか基準がないとそうなるんよね
だから途中経過だけでもと思ってスレたてた
24
名無しさん
2023/03/16(木) 00:26:40 ID:RoG5rLml08主
>>22 ワイ実は末尾をどう利用したらいいのかわかんないんよ。なんかいいアイディアあったら教えて
IDは全部あるから、分析だけすればいける
25
名無しさん
2023/03/16(木) 00:27:48 ID:RoG5rLml08主
あと、ベイズも何に利用したらいいかまだアイディアがない。そのうち出るかもしれんけど、もととなる確率にどんなのが利用できるかアイディアがない
26
名無しさん
2023/03/16(木) 00:29:01 ID:JARNgVEg03
>>24 0とそれ以外で分けるとかかなあ
単発末尾0と単発末尾dじゃ意味変わってきそうやなって思った
27
名無しさん
2023/03/16(木) 00:29:49 ID:9360SBWS00
28
名無しさん
2023/03/16(木) 00:30:24 ID:ZQWu1txjd9
29
名無しさん
2023/03/16(木) 00:31:19 ID:AlbgKLZbMC
ちゃんとアフィ多いなんJとかと比べたほうがええで
30
名無しさん
2023/03/16(木) 00:31:55 ID:RoG5rLml08主
>>26 なるほどね、さらにのID末尾で分類もできるし、
条件なしで末尾IDだけで分類もできるね
31
名無しさん
2023/03/16(木) 00:33:17 ID:AlbgKLZbMC
>>7 ベイズ緑本ってデータ解析のための統計モデリング入門(久保拓弥)ちゃうの?
前回なかったような
これはライブラリとか陳腐化しててあかんはずやったような
32
名無しさん
2023/03/16(木) 00:33:21 ID:uDh9nIX6dD
こういうのってやっぱ難しいんやな
いつも見てる5chの統計サイトが鯖落ちの影響か見れなくて困っとる
33
名無しさん
2023/03/16(木) 00:34:20 ID:RoG5rLml08主
>>29 5chはdat読めないからそもそも収集できない
APIキー使ってプロクシ通せばいけるのかもしれないけど、ちょっとそこまでは
34
名無しさん
2023/03/16(木) 00:34:39 ID:tncwA7ox00
3Gの末尾って2桁やない?
00
08
09
0B
固定回線?でもこんな感じちゃう?
35
名無しさん
2023/03/16(木) 00:34:47 ID:RoG5rLml08主
36
名無しさん
2023/03/16(木) 00:35:41 ID:RoG5rLml08主
37
名無しさん
2023/03/16(木) 00:35:46 ID:9360SBWS00
38
名無しさん
2023/03/16(木) 00:36:37 ID:u6D812+408
でも油断すると「オチチが出ちゃったね」みたいなスレがまとめられるからアフィスレはどうしても警戒してしまうんだ😢
39
名無しさん
2023/03/16(木) 00:37:06 ID:+s6QIItR0E
ようやっとる
40
名無しさん
2023/03/16(木) 00:37:37 ID:RoG5rLml08主
>>38 むしろオチチのスレがイレギュラーだったんやないかなって今は考えてきた
41
名無しさん
2023/03/16(木) 00:37:38 ID:a0FvU5Ho03
さんGってID結構変わるけどその影響はあるの?
42
名無しさん
2023/03/16(木) 00:37:55 ID:2sa0Hlmt0E
>>32 主要な板で死んでるの5Gだけのはずやのにあのサイト全部逝っとるんよな
43
名無しさん
2023/03/16(木) 00:38:27 ID:ZQuSYkuo08
idchangeが混じると単発率は上がるのか
もっと下がる方向へのノイズなら結局アフィはいないって結論に繋がるんちゃう
44
名無しさん
2023/03/16(木) 00:38:35 ID:AlbgKLZbMC
45
名無しさん
2023/03/16(木) 00:39:26 ID:AlbgKLZbMC
46
名無しさん
2023/03/16(木) 00:40:11 ID:RoG5rLml08主
47
名無しさん
2023/03/16(木) 00:40:43 ID:RoG5rLml08主
48
名無しさん
2023/03/16(木) 00:42:30 ID:RoG5rLml08主
>>44 あと、scからとってくるのが楽かもね
一度やろうとしたことがある
49
名無しさん
2023/03/16(木) 00:43:04 ID:ZQWu1txjd9
なんJチラッと見てからこっち見ると
こっちに立ってるのは個人的に好かないのはあってもそれでも全然かわいいものやなと感じるな
それこそなんJで見慣れたスレはこっちでは立たないし
たまに立っても誹謗中傷じゃなくてネタよりのもの
50
名無しさん
2023/03/16(木) 00:44:17 ID:u6D812+408
51
名無しさん
2023/03/16(木) 00:45:52 ID:AlbgKLZbMC
>>40 単発ID率で偶然かどうかt検定辺りしてみたらええんちゃうかな
52
名無しさん
2023/03/16(木) 00:45:56 ID:a0FvU5Ho03
というかなんでIDもワッチョイもコロコロ変わるんやろ
53
名無しさん
2023/03/16(木) 00:46:11 ID:AlbgKLZbMC
分布なんてわからんのやからウェルチ使うんやで
54
名無しさん
2023/03/16(木) 00:50:27 ID:ZQuSYkuo08
ID毎の書き込み数でヒストグラム作ったらどんな感じなんやろ
正規分布じゃなくてふた山型になりそうな気がする
55
名無しさん
2023/03/16(木) 00:53:28 ID:AlbgKLZbMC
>>54 多分1回以外は対数正規分布なる気がするわ
1回が一番高い
56
名無しさん
2023/03/16(木) 00:53:37 ID:AlbgKLZbMC
なんJとかならの話や
57
名無しさん
2023/03/16(木) 00:54:59 ID:RoG5rLml08主
>>51 >>53 ありがとう、そういうの助かる
>>54 それはワイも気になってる
ヒストグラムいいね
ちなみに今やってたら、ID別書き込み数のトップ1は197回やった
58
名無しさん
2023/03/16(木) 00:56:25 ID:AlbgKLZbMC
t検定くらいならデータ取れるならRやと1行くらいやで
59
名無しさん
2023/03/16(木) 00:59:09 ID:RoG5rLml08主
Rかあ・・Rねえ・・
60
名無しさん
2023/03/16(木) 01:00:15 ID:RoG5rLml08主
書き込み件数の分布を分析するなら
平均、中央値、分散ぐらいかな?
あとなんか一般的なのある?
61
名無しさん
2023/03/16(木) 01:02:14 ID:mculUhjjd9
ポルポトはなんだよ
62
名無しさん
2023/03/16(木) 01:04:20 ID:AlbgKLZbMC
等分散とか
63
名無しさん
2023/03/16(木) 01:04:32 ID:AlbgKLZbMC
64
名無しさん
2023/03/16(木) 01:05:57 ID:RoG5rLml08主
>>61 このスレに書き込んだ奴はインテリだから死刑や
65
名無しさん
2023/03/16(木) 01:07:18 ID:RoG5rLml08主
とりあえずすぐできるやつからいくで
66
名無しさん
2023/03/16(木) 01:09:56 ID:AlbgKLZbMC
独立な2群か母比率の検定をやりたいんやがサンプルサイズが小さそうやから正規分布が使えるかわからん
多分使えない
67
名無しさん
2023/03/16(木) 01:09:59 ID:qjst3rt70B
このスレ見てたらもう一度統計学を学び直したくなってきたわ
68
名無しさん
2023/03/16(木) 01:11:20 ID:RoG5rLml08主
平均は4.210161272132627
中央値は1.0058637798827244
4分位らしい
69
名無しさん
2023/03/16(木) 01:11:27 ID:LIrD98I+0E
アフィの特徴
>>1の建てっぱなし
【】を使ったスレタイ
スレタイロンダ
あと、なんかあるんか?
70
名無しさん
2023/03/16(木) 01:12:28 ID:Q4OEQ1VUd7
3Gロンダされてないかは注意しておく必要がある
71
名無しさん
2023/03/16(木) 01:13:18 ID:RoG5rLml08主
>>69 ワイが探したのはあと、
弱者男性
チー牛
←
72
名無しさん
2023/03/16(木) 01:15:41 ID:AlbgKLZbMC
U検定が無難か?
小標本やし
73
名無しさん
2023/03/16(木) 01:15:45 ID:JARNgVEg03
そういやこれIDって主も込みなん?
mateやと別ID扱いされてるっぽいけど
74
名無しさん
2023/03/16(木) 01:16:37 ID:VqZATY4E0B
今のところそうだと思うけど常に警戒は必要かと
75
名無しさん
2023/03/16(木) 01:16:56 ID:RoG5rLml08主
76
名無しさん
2023/03/16(木) 01:19:59 ID:AlbgKLZbMC
>>75 Pythonはstaticとかのライブラリなかった?
scipyでもええが
Rで書かせたほうがコード短いからええで
77
名無しさん
2023/03/16(木) 01:20:36 ID:RoG5rLml08主
やっぱこのレベルだとSQLは辛いメンスね
pythonでやることにします
78
名無しさん
2023/03/16(木) 01:22:42 ID:X+Zgwj0U08
そういやハチナイスレのアフィって今どうしてるんや
ここ来たらまとめできなくなって死んだって聞いたけど実態が知りたい
79
名無しさん
2023/03/16(木) 01:23:18 ID:AlbgKLZbMC
80
名無しさん
2023/03/16(木) 01:28:33 ID:RoG5rLml08主
>>79 とりあえずここから買ってみようかな・・
ちな、結果
Mann-Whitney Uテストの結果:
統計量: [39888622.]
p値: [0.430231]
81
名無しさん
2023/03/16(木) 01:31:10 ID:RoG5rLml08主
やってもワイが読み取れないから
あんまアレやな
このあたり教養の差や
82
名無しさん
2023/03/16(木) 01:31:34 ID:AlbgKLZbMC
>>80 有意差出てないな
R?
Rでデフォなら95%やから偶然ではないとは言えない感じか
83
名無しさん
2023/03/16(木) 01:35:41 ID:RoG5rLml08主
84
名無しさん
2023/03/16(木) 01:37:30 ID:AlbgKLZbMC
>>83 なら有意水準何かわからんわ
多分95%やとは思うけど
有意水準いくつがいいのかは分野によって変わるらしいんやけどいくつに設定したらいいかはわいはクソザコなので分からん😭
85
名無しさん
2023/03/16(木) 01:38:04 ID:RoG5rLml08主
数値以外の要素混じってるっぽいから
消してもっかいやね
86
名無しさん
2023/03/16(木) 01:38:50 ID:AlbgKLZbMC
データのクリーニングしないで突っ込んだんか
そらおかしくなる
これ一番だるいんよな……
87
名無しさん
2023/03/16(木) 01:40:50 ID:AlbgKLZbMC
検定力とか見といたほうがええんやがこのくらいなら見なくてええやろ多分
サンプルサイズ変えられないし
88
名無しさん
2023/03/16(木) 01:40:58 ID:RoG5rLml08主
このライブ感よ
89
名無しさん
2023/03/16(木) 01:52:21 ID:RoG5rLml08主
こうなった
Mann-Whitney Uテストの結果:
統計量: 40240916.0
p値: 0.49304772834745914
平均: 4.199966467333594
中央値: 2
分散: 456.9101564933982
標本数: 17893
90
名無しさん
2023/03/16(木) 01:55:16 ID:ZD+h0594aC
こういうスレわくわくする
91
名無しさん
2023/03/16(木) 01:55:22 ID:RoG5rLml08主
うーん、なるほどわからん
Mann-Whitney Uテストは、2つの標本間の中央値に有意な差があるかどうかを検定するために使用されます。ここでは、統計量が40240916.0で、p値が0.49304772834745914であることが報告されています。
統計量は、Uテストの結果から得られた値で、2つの標本間の順位差を合計したものです。この値が大きいほど、2つの標本間の差が小さいことを示しています。この場合、統計量が非常に大きいため、2つの標本間にはほとんど差がないことが示唆されます。
p値は、帰無仮説が正しいと仮定した場合に、観察されたデータよりも極端なデータが得られる確率を表します。この場合、p値が0.49304772834745914であるため、帰無仮説が正しいと仮定した場合、2つの標本間には有意な差がない可能性が高いことを示唆しています。一般的に、p値が0.05以下である場合は、結果が統計的に有意であると見なされますが、この場合はp値が0.05を上回っているため、結果は有意ではないと判断されます。
以上のことから、この結果は、2つの標本間には有意な差がなく、その差は偶然によるものである可能性が高いことを示唆しています。
92
名無しさん
2023/03/16(木) 01:56:55 ID:AlbgKLZbMC
93
名無しさん
2023/03/16(木) 01:59:01 ID:a7tuFnLJ08
転載禁止の板でスレ立てるほど暇じゃないんやろ
あっちも一応仕事なんやから
アフィに毒されて○報AさんXしてしまう←これみたいなスレタイで煽ってる奴はろくなやつじゃないと思うけど
94
名無しさん
2023/03/16(木) 02:03:24 ID:RoG5rLml08主
>>92 ひょっとしてなんJとさんGを比較したかったの?データはなんGしかないから、さんGのid別のリストを単純に分けてるだけだぞ
昇順で並べるとかしないと意味なくない?
group1 = post_count_list[:len(post_count_list)//2]
group2 = post_count_list[len(post_count_list)//2:]
95
名無しさん
2023/03/16(木) 02:04:02 ID:qqDhzZFVMC
ワイ的にはスレの種類のクラスター分析してからのほうがいい結果出そうやとは思うけど
96
名無しさん
2023/03/16(木) 02:04:42 ID:qqDhzZFVMC
97
名無しさん
2023/03/16(木) 02:06:04 ID:qqDhzZFVMC
データどう操作したかわからんからU検定でええと思うんやけどわからんわ
電池また切れそう
98
名無しさん
2023/03/16(木) 02:08:02 ID:RoG5rLml08主
降順でリストを並べると、結果がこうなった
Mann-Whitney Uテストの結果:
統計量: 80442232.0
p値: 0.0
99
名無しさん
2023/03/16(木) 02:08:44 ID:RoG5rLml08主
うんち💩
100
名無しさん
2023/03/16(木) 02:09:21 ID:qqDhzZFVMC
ちょっとわいもU検定は調べ直しとくわ
101
名無しさん
2023/03/16(木) 02:10:06 ID:RoG5rLml08主
102
名無しさん
2023/03/16(木) 02:10:22 ID:qqDhzZFVMC
寝る
103
名無しさん
2023/03/16(木) 02:23:39 ID:RoG5rLml08主
-----Mann-Whitney Uテストの結果:
統計量: 80693975.0
p値: 0.0
-----平均、中央値、分散
平均: 4.196226835104903
中央値: 2
分散: 455.1562836253016
標本数: 17969
-----ベンフォードの法則
数字の出現頻度: [0.5576826757192943, 0.17680449663309034, 0.09438477377706049, 0.057153987422783686, 0.040069007735544546, 0.026657020424063666, 0.019477989871445268, 0.016639768490177526, 0.011130279926540152]
ベンフォードの法則に従った割合: [0.3010299956639812, 0.17609125905568124, 0.12493873660829992, 0.09691001300805642, 0.07918124604762482, 0.06694678963061322, 0.05799194697768673, 0.05115252244738129, 0.04575749056067514]
104
名無しさん
2023/03/16(木) 02:28:04 ID:RoG5rLml08主
>>103 というのが、ID別書き込み数(降順)の分析結果やった
105
名無しさん
2023/03/16(木) 03:08:03 ID:9Bxw2e0O0E
書き込みってどう取得するんや?
APIがあるのか
106
名無しさん
2023/03/16(木) 03:12:04 ID:RoG5rLml08主
def scrape_thread_content_from_key(key):
"""threadのキーを引数にして、datファイルからthreadの内容を取り出す"""
url = f"
https://hayabusa4.3chan.jp/livegalileo/dat/{key}.dat"
lines = get_metadata_from_url(url)
parsed_lines = extract_thread_info_from_lines(lines, extract_thread_content_from_dat)
parsed_lines = parsed_lines
return parsed_lines
107
名無しさん
2023/03/16(木) 03:17:51 ID:9Bxw2e0O0E
うおおおおおおお
すごい
3chって便利やなあ
108
名無しさん
2023/03/16(木) 04:14:39 ID:RoG5rLml08主
寝る前に保守しとくか
109
名無しさん
2023/03/16(木) 04:15:20 ID:RoG5rLml08主
110
名無しさん
2023/03/16(木) 05:42:16 ID:FxBWbA+i0E
さんGの仕様がどうこうより
5Gが機能してるうちはア フィもこっちこないんやな
まあ来たとしてもコマンドあるから多少マシかわからんが
111
名無しさん
2023/03/16(木) 05:55:42 ID:x8td+Ph4a5
こっちで貼られた画像はしょっちゅう5Gに転載されてるぞ
112
名無しさん
2023/03/16(木) 08:02:11 ID:YWz1TpKk0E
人少ないし反アフィの空気あるしアフィカスは来ないでしょ
ロンダはされるかもしれんが
113
名無しさん
2023/03/16(木) 08:03:14 ID:f3o6bNWZ09
ロンダも報告すりゃ対応するいうてへんかったか?
114
名無しさん
2023/03/16(木) 08:03:49 ID:iiSxlSYa01
ロンダでも通報したら剥がせたし
115
名無しさん
2023/03/16(木) 08:20:42 ID:MYQZ6ByxpC
1日2レスってそんないないのか
116
名無しさん
2023/03/16(木) 08:21:31 ID:ckR4lHPmM0
117
名無しさん
2023/03/16(木) 08:22:09 ID:XaoG2Z3fd9
WBCと虫トコがある日とない日で全然違う気もする
118
名無しさん
2023/03/16(木) 08:25:50 ID:BCeXrPayd5
数字とかデータ並べやがってお前インテリか?
119
名無しさん
2023/03/16(木) 08:33:41 ID:xY0chStNpE
仕事柄統計使ってるのにこのスレ見てると自分がいかに脳死で統計解析してたかがよう分かるわ
120
名無しさん
2023/03/16(木) 08:35:56 ID:t3Vsuqjsd9
このスレ頭良さそう
オデ ゼンゼン ワカラナイ
121
名無しさん
2023/03/16(木) 08:41:38 ID:mo3FMPrD0F
>>110 主つきはじめた頃に自演しとったのはほんま草
122
名無しさん
2023/03/16(木) 09:05:19 ID:VQC7++0n0E
そりゃアフィだってロンダで転載できるとはいえ
このサイトの規約で自演までして転載する手間とリスクなんて負わないでしょ
123
名無しさん
2023/03/16(木) 09:13:50 ID:3qw71VMzd7
勉強になりますなあ…
124
名無しさん
2023/03/16(木) 09:20:09 ID:mirxEpTk03
統計サッパリやけど
普段は膨大なデータに隠されてる相関を発見するってのが
面白そう
125
名無しさん
2023/03/16(木) 09:54:42 ID:QalexbboaC
マジでアフィアフィ叫んでるやつって息苦しそうよな
126
名無しさん
2023/03/16(木) 09:58:38 ID:fBwsF+Jm09
つまりアフィっぽいスレ立て続けてるのはアフィカスじゃなく衝撃ガイジみたいな存在ってことか?
127
名無しさん
2023/03/16(木) 10:02:00 ID:VqZATY4E0B
128
名無しさん
2023/03/16(木) 10:08:36 ID:xt9UrK7DaC
アフィっぽいスレってなんだよとは思う
食いつき良さそうな時事ネタほぼ全部アフィ認定するアホいるし
その結果ナッシュスレ改変みたいなテンプレスレしか残らない地獄
129
名無しさん
2023/03/16(木) 10:41:30 ID:q2eDhPaY08
>>128 ほんまこれ
前はこんなのいなかったから移民がアフィ連呼してるんかね
130
名無しさん
2023/03/16(木) 11:16:27 ID:W+f9RGU80B
○報Aさん「B」←これwwwwwみたいなスレタイはアフィっぽいなと思う
131
名無しさん
2023/03/16(木) 11:43:44 ID:LF75zBh+0B
ナッシュ構文とかおもくそVIP時代のアフィスレタイなのに
132
名無しさん
2023/03/16(木) 12:07:46 ID:VqZATY4E0B
>>131 そうなんや
VIP経由してないやつとかもおりそうやし気づかんか
133
名無しさん
2023/03/16(木) 12:10:55 ID:ICimYVGoaC
ニューススレでもスレタイに煽る意志が見えるかどうかやろ あったらアフィ認定でええわ
134
名無しさん
2023/03/16(木) 12:12:38 ID:VqZATY4E0B
>>133 ○○さん△△してしまうwwwwwwこれもう✕✕だろwwwww
みたいなやつとかね