1
名無しさん
2023/03/16(木) 00:09:48 ID:RoG5rLml08
3/13~に限っていうと、殆どそれらしき形跡が見えない
少なくとも自作自演で盛り上げてるような形跡は全くない
引き続きポルポト政権のご支援をよろしくお願いします
2
名無しさん
2023/03/16(木) 00:11:26 ID:RoG5rLml08主
3
名無しさん
2023/03/16(木) 00:12:32 ID:RoG5rLml08主
単発IDをキーにしてアフィが好きそうなスレタイを探してるんだけど、殆どそういう形跡が見られないという印象
4
名無しさん
2023/03/16(木) 00:12:59 ID:6riEgiNe00
ようやっとる
5
名無しさん
2023/03/16(木) 00:13:22 ID:RoG5rLml08主
6
名無しさん
2023/03/16(木) 00:13:32 ID:5hdooJkz0F
ポルポトってスレタイに入れない方が伸びそう
7
名無しさん
2023/03/16(木) 00:13:55 ID:9360SBWS00
乙!ベイズ緑本紹介した者やが前回はとにかく楽しかったよ
スレ立て待ってた
8
名無しさん
2023/03/16(木) 00:14:28 ID:tncwA7ox00
ナイス👍
彡((^💋^))ミ n
⌒`γ´⌒`ヽ( E)
( .人 .人 γ /
=(こ/こ/ `^´
9
名無しさん
2023/03/16(木) 00:15:46 ID:RoG5rLml08主
>>7 この前はサンガツ
SQLに悩みながらちょっとずつ進めてる
10
名無しさん
2023/03/16(木) 00:16:25 ID:u6D812+408
ポル・ポトってどういうことや?統計の歴史となんか関係あるんか?
11
名無しさん
2023/03/16(木) 00:16:52 ID:RoG5rLml08主
>>2をみてみればわかるんだけど、
単発ID率と書き込み件数が逆相関なんよ
いまのところ不自然な点が全くない
12
名無しさん
2023/03/16(木) 00:17:22 ID:RoG5rLml08主
13
名無しさん
2023/03/16(木) 00:18:03 ID:uDh9nIX6dD
>>11 不思議な結果やな思ったらそういうことなんやな
14
名無しさん
2023/03/16(木) 00:19:29 ID:PvRFxT5y02
ようやっとる
15
名無しさん
2023/03/16(木) 00:20:39 ID:RoG5rLml08主
>>13 そうなんよ、時間別にみると5時台とかは書き込みが少ないから単発ID率は60パーセントを超えるくらい
16
名無しさん
2023/03/16(木) 00:20:51 ID:5RGqyZ9Q0A
それじゃあ過敏にアフィアフィ騒いで普通のニューススレを潰してる3G民が統失みたいじゃん🤣
17
名無しさん
2023/03/16(木) 00:21:06 ID:O+yYroSVS8
単発の基準が分からんからなんとも言えん部分もあるが
例えば複数書き込んでても実は似た系統のスレだったって事はあるだろうし
ただ言えば最近一番伸びたスレがバウアーで
1はいなかったが思ったよりずっと平和に進行してたしほとんどのレスは人間なんやろね
18
名無しさん
2023/03/16(木) 00:21:51 ID:u6D812+408
19
名無しさん
2023/03/16(木) 00:22:25 ID:5hdooJkz0F
明らかに煽ろうって単発は見るけどアフィっぽいのは少ないのかもね
20
名無しさん
2023/03/16(木) 00:23:46 ID:TdTvH9Y80F
欲を出せばidchangeスレを抜いた統計とかも欲しいわね
21
名無しさん
2023/03/16(木) 00:24:05 ID:RoG5rLml08主
>>17 単発ID率の基準は以下にしてる
1度しか書き込みがないID / (全体の書き込み数 - !changeidスレの書き込み数) * 100
22
名無しさん
2023/03/16(木) 00:25:02 ID:JARNgVEg03
末尾のデータとかもあるといいかも?
23
名無しさん
2023/03/16(木) 00:25:21 ID:RoG5rLml08主
>>17 なんか基準がないとそうなるんよね
だから途中経過だけでもと思ってスレたてた
24
名無しさん
2023/03/16(木) 00:26:40 ID:RoG5rLml08主
>>22 ワイ実は末尾をどう利用したらいいのかわかんないんよ。なんかいいアイディアあったら教えて
IDは全部あるから、分析だけすればいける
25
名無しさん
2023/03/16(木) 00:27:48 ID:RoG5rLml08主
あと、ベイズも何に利用したらいいかまだアイディアがない。そのうち出るかもしれんけど、もととなる確率にどんなのが利用できるかアイディアがない
26
名無しさん
2023/03/16(木) 00:29:01 ID:JARNgVEg03
>>24 0とそれ以外で分けるとかかなあ
単発末尾0と単発末尾dじゃ意味変わってきそうやなって思った
27
名無しさん
2023/03/16(木) 00:29:49 ID:9360SBWS00
28
名無しさん
2023/03/16(木) 00:30:24 ID:ZQWu1txjd9
29
名無しさん
2023/03/16(木) 00:31:19 ID:AlbgKLZbMC
ちゃんとアフィ多いなんJとかと比べたほうがええで
30
名無しさん
2023/03/16(木) 00:31:55 ID:RoG5rLml08主
>>26 なるほどね、さらにのID末尾で分類もできるし、
条件なしで末尾IDだけで分類もできるね
31
名無しさん
2023/03/16(木) 00:33:17 ID:AlbgKLZbMC
>>7 ベイズ緑本ってデータ解析のための統計モデリング入門(久保拓弥)ちゃうの?
前回なかったような
これはライブラリとか陳腐化しててあかんはずやったような
32
名無しさん
2023/03/16(木) 00:33:21 ID:uDh9nIX6dD
こういうのってやっぱ難しいんやな
いつも見てる5chの統計サイトが鯖落ちの影響か見れなくて困っとる
33
名無しさん
2023/03/16(木) 00:34:20 ID:RoG5rLml08主
>>29 5chはdat読めないからそもそも収集できない
APIキー使ってプロクシ通せばいけるのかもしれないけど、ちょっとそこまでは
34
名無しさん
2023/03/16(木) 00:34:39 ID:tncwA7ox00
3Gの末尾って2桁やない?
00
08
09
0B
固定回線?でもこんな感じちゃう?
35
名無しさん
2023/03/16(木) 00:34:47 ID:RoG5rLml08主
36
名無しさん
2023/03/16(木) 00:35:41 ID:RoG5rLml08主
37
名無しさん
2023/03/16(木) 00:35:46 ID:9360SBWS00
38
名無しさん
2023/03/16(木) 00:36:37 ID:u6D812+408
でも油断すると「オチチが出ちゃったね」みたいなスレがまとめられるからアフィスレはどうしても警戒してしまうんだ😢
39
名無しさん
2023/03/16(木) 00:37:06 ID:+s6QIItR0E
ようやっとる
40
名無しさん
2023/03/16(木) 00:37:37 ID:RoG5rLml08主
>>38 むしろオチチのスレがイレギュラーだったんやないかなって今は考えてきた
41
名無しさん
2023/03/16(木) 00:37:38 ID:a0FvU5Ho03
さんGってID結構変わるけどその影響はあるの?
42
名無しさん
2023/03/16(木) 00:37:55 ID:2sa0Hlmt0E
>>32 主要な板で死んでるの5Gだけのはずやのにあのサイト全部逝っとるんよな
43
名無しさん
2023/03/16(木) 00:38:27 ID:ZQuSYkuo08
idchangeが混じると単発率は上がるのか
もっと下がる方向へのノイズなら結局アフィはいないって結論に繋がるんちゃう
44
名無しさん
2023/03/16(木) 00:38:35 ID:AlbgKLZbMC
45
名無しさん
2023/03/16(木) 00:39:26 ID:AlbgKLZbMC
46
名無しさん
2023/03/16(木) 00:40:11 ID:RoG5rLml08主
47
名無しさん
2023/03/16(木) 00:40:43 ID:RoG5rLml08主
48
名無しさん
2023/03/16(木) 00:42:30 ID:RoG5rLml08主
>>44 あと、scからとってくるのが楽かもね
一度やろうとしたことがある
49
名無しさん
2023/03/16(木) 00:43:04 ID:ZQWu1txjd9
なんJチラッと見てからこっち見ると
こっちに立ってるのは個人的に好かないのはあってもそれでも全然かわいいものやなと感じるな
それこそなんJで見慣れたスレはこっちでは立たないし
たまに立っても誹謗中傷じゃなくてネタよりのもの
50
名無しさん
2023/03/16(木) 00:44:17 ID:u6D812+408
51
名無しさん
2023/03/16(木) 00:45:52 ID:AlbgKLZbMC
>>40 単発ID率で偶然かどうかt検定辺りしてみたらええんちゃうかな
52
名無しさん
2023/03/16(木) 00:45:56 ID:a0FvU5Ho03
というかなんでIDもワッチョイもコロコロ変わるんやろ
53
名無しさん
2023/03/16(木) 00:46:11 ID:AlbgKLZbMC
分布なんてわからんのやからウェルチ使うんやで
54
名無しさん
2023/03/16(木) 00:50:27 ID:ZQuSYkuo08
ID毎の書き込み数でヒストグラム作ったらどんな感じなんやろ
正規分布じゃなくてふた山型になりそうな気がする
55
名無しさん
2023/03/16(木) 00:53:28 ID:AlbgKLZbMC
>>54 多分1回以外は対数正規分布なる気がするわ
1回が一番高い
56
名無しさん
2023/03/16(木) 00:53:37 ID:AlbgKLZbMC
なんJとかならの話や
57
名無しさん
2023/03/16(木) 00:54:59 ID:RoG5rLml08主
>>51 >>53 ありがとう、そういうの助かる
>>54 それはワイも気になってる
ヒストグラムいいね
ちなみに今やってたら、ID別書き込み数のトップ1は197回やった
58
名無しさん
2023/03/16(木) 00:56:25 ID:AlbgKLZbMC
t検定くらいならデータ取れるならRやと1行くらいやで
59
名無しさん
2023/03/16(木) 00:59:09 ID:RoG5rLml08主
Rかあ・・Rねえ・・
60
名無しさん
2023/03/16(木) 01:00:15 ID:RoG5rLml08主
書き込み件数の分布を分析するなら
平均、中央値、分散ぐらいかな?
あとなんか一般的なのある?
61
名無しさん
2023/03/16(木) 01:02:14 ID:mculUhjjd9
ポルポトはなんだよ
62
名無しさん
2023/03/16(木) 01:04:20 ID:AlbgKLZbMC
等分散とか
63
名無しさん
2023/03/16(木) 01:04:32 ID:AlbgKLZbMC
64
名無しさん
2023/03/16(木) 01:05:57 ID:RoG5rLml08主
>>61 このスレに書き込んだ奴はインテリだから死刑や
65
名無しさん
2023/03/16(木) 01:07:18 ID:RoG5rLml08主
とりあえずすぐできるやつからいくで
66
名無しさん
2023/03/16(木) 01:09:56 ID:AlbgKLZbMC
独立な2群か母比率の検定をやりたいんやがサンプルサイズが小さそうやから正規分布が使えるかわからん
多分使えない
67
名無しさん
2023/03/16(木) 01:09:59 ID:qjst3rt70B
このスレ見てたらもう一度統計学を学び直したくなってきたわ
68
名無しさん
2023/03/16(木) 01:11:20 ID:RoG5rLml08主
平均は4.210161272132627
中央値は1.0058637798827244
4分位らしい
69
名無しさん
2023/03/16(木) 01:11:27 ID:LIrD98I+0E
アフィの特徴
>>1の建てっぱなし
【】を使ったスレタイ
スレタイロンダ
あと、なんかあるんか?
70
名無しさん
2023/03/16(木) 01:12:28 ID:Q4OEQ1VUd7
3Gロンダされてないかは注意しておく必要がある
71
名無しさん
2023/03/16(木) 01:13:18 ID:RoG5rLml08主
>>69 ワイが探したのはあと、
弱者男性
チー牛
←
72
名無しさん
2023/03/16(木) 01:15:41 ID:AlbgKLZbMC
U検定が無難か?
小標本やし
73
名無しさん
2023/03/16(木) 01:15:45 ID:JARNgVEg03
そういやこれIDって主も込みなん?
mateやと別ID扱いされてるっぽいけど
74
名無しさん
2023/03/16(木) 01:16:37 ID:VqZATY4E0B
今のところそうだと思うけど常に警戒は必要かと
75
名無しさん
2023/03/16(木) 01:16:56 ID:RoG5rLml08主
76
名無しさん
2023/03/16(木) 01:19:59 ID:AlbgKLZbMC
>>75 Pythonはstaticとかのライブラリなかった?
scipyでもええが
Rで書かせたほうがコード短いからええで
77
名無しさん
2023/03/16(木) 01:20:36 ID:RoG5rLml08主
やっぱこのレベルだとSQLは辛いメンスね
pythonでやることにします
78
名無しさん
2023/03/16(木) 01:22:42 ID:X+Zgwj0U08
そういやハチナイスレのアフィって今どうしてるんや
ここ来たらまとめできなくなって死んだって聞いたけど実態が知りたい
79
名無しさん
2023/03/16(木) 01:23:18 ID:AlbgKLZbMC
80
名無しさん
2023/03/16(木) 01:28:33 ID:RoG5rLml08主
>>79 とりあえずここから買ってみようかな・・
ちな、結果
Mann-Whitney Uテストの結果:
統計量: [39888622.]
p値: [0.430231]
81
名無しさん
2023/03/16(木) 01:31:10 ID:RoG5rLml08主
やってもワイが読み取れないから
あんまアレやな
このあたり教養の差や
82
名無しさん
2023/03/16(木) 01:31:34 ID:AlbgKLZbMC
>>80 有意差出てないな
R?
Rでデフォなら95%やから偶然ではないとは言えない感じか
83
名無しさん
2023/03/16(木) 01:35:41 ID:RoG5rLml08主
84
名無しさん
2023/03/16(木) 01:37:30 ID:AlbgKLZbMC
>>83 なら有意水準何かわからんわ
多分95%やとは思うけど
有意水準いくつがいいのかは分野によって変わるらしいんやけどいくつに設定したらいいかはわいはクソザコなので分からん😭
85
名無しさん
2023/03/16(木) 01:38:04 ID:RoG5rLml08主
数値以外の要素混じってるっぽいから
消してもっかいやね
86
名無しさん
2023/03/16(木) 01:38:50 ID:AlbgKLZbMC
データのクリーニングしないで突っ込んだんか
そらおかしくなる
これ一番だるいんよな……
87
名無しさん
2023/03/16(木) 01:40:50 ID:AlbgKLZbMC
検定力とか見といたほうがええんやがこのくらいなら見なくてええやろ多分
サンプルサイズ変えられないし
88
名無しさん
2023/03/16(木) 01:40:58 ID:RoG5rLml08主
このライブ感よ
89
名無しさん
2023/03/16(木) 01:52:21 ID:RoG5rLml08主
こうなった
Mann-Whitney Uテストの結果:
統計量: 40240916.0
p値: 0.49304772834745914
平均: 4.199966467333594
中央値: 2
分散: 456.9101564933982
標本数: 17893
90
名無しさん
2023/03/16(木) 01:55:16 ID:ZD+h0594aC
こういうスレわくわくする
91
名無しさん
2023/03/16(木) 01:55:22 ID:RoG5rLml08主
うーん、なるほどわからん
Mann-Whitney Uテストは、2つの標本間の中央値に有意な差があるかどうかを検定するために使用されます。ここでは、統計量が40240916.0で、p値が0.49304772834745914であることが報告されています。
統計量は、Uテストの結果から得られた値で、2つの標本間の順位差を合計したものです。この値が大きいほど、2つの標本間の差が小さいことを示しています。この場合、統計量が非常に大きいため、2つの標本間にはほとんど差がないことが示唆されます。
p値は、帰無仮説が正しいと仮定した場合に、観察されたデータよりも極端なデータが得られる確率を表します。この場合、p値が0.49304772834745914であるため、帰無仮説が正しいと仮定した場合、2つの標本間には有意な差がない可能性が高いことを示唆しています。一般的に、p値が0.05以下である場合は、結果が統計的に有意であると見なされますが、この場合はp値が0.05を上回っているため、結果は有意ではないと判断されます。
以上のことから、この結果は、2つの標本間には有意な差がなく、その差は偶然によるものである可能性が高いことを示唆しています。
92
名無しさん
2023/03/16(木) 01:56:55 ID:AlbgKLZbMC
93
名無しさん
2023/03/16(木) 01:59:01 ID:a7tuFnLJ08
転載禁止の板でスレ立てるほど暇じゃないんやろ
あっちも一応仕事なんやから
アフィに毒されて○報AさんXしてしまう←これみたいなスレタイで煽ってる奴はろくなやつじゃないと思うけど
94
名無しさん
2023/03/16(木) 02:03:24 ID:RoG5rLml08主
>>92 ひょっとしてなんJとさんGを比較したかったの?データはなんGしかないから、さんGのid別のリストを単純に分けてるだけだぞ
昇順で並べるとかしないと意味なくない?
group1 = post_count_list[:len(post_count_list)//2]
group2 = post_count_list[len(post_count_list)//2:]
95
名無しさん
2023/03/16(木) 02:04:02 ID:qqDhzZFVMC
ワイ的にはスレの種類のクラスター分析してからのほうがいい結果出そうやとは思うけど
96
名無しさん
2023/03/16(木) 02:04:42 ID:qqDhzZFVMC
97
名無しさん
2023/03/16(木) 02:06:04 ID:qqDhzZFVMC
データどう操作したかわからんからU検定でええと思うんやけどわからんわ
電池また切れそう
98
名無しさん
2023/03/16(木) 02:08:02 ID:RoG5rLml08主
降順でリストを並べると、結果がこうなった
Mann-Whitney Uテストの結果:
統計量: 80442232.0
p値: 0.0
99
名無しさん
2023/03/16(木) 02:08:44 ID:RoG5rLml08主
うんち💩
100
名無しさん
2023/03/16(木) 02:09:21 ID:qqDhzZFVMC
ちょっとわいもU検定は調べ直しとくわ
101
名無しさん
2023/03/16(木) 02:10:06 ID:RoG5rLml08主