KeyFansClub 2010 星座统计统计数据截至2010年5月14日,the 2904th day
回顾:第一次社区人口普查报告http://www.keyfc.net/bbs/showtopic-27890.aspx星座资料十二星座所对应的生日:
白羊座:3月21日 - 4月20日
金牛座:4月21日 - 5月21日
双子座:5月22日 - 6月21日
巨蟹座:6月22日 - 7月22日
狮子座:7月23日 - 8月23日
处女座:8月24日 - 9月23日
天秤座:9月24日 - 10月23日
天蝎座:10月24日 - 11月22日
射手座:11月23日 - 12月21日
魔羯座:12月22日 - 1月20日
水瓶座:1月21日 - 2月19日
双鱼座:2月20日 - 3月20日
十二星座的性格介绍:
http://astro.sina.com.cn/通常说的星座是指太阳星座,十二宫的详细计算请见:
http://www.horo.idv.tw/Astrolog32/AstrologyInput.php基本统计信息有效统计人数:5312人,占总会员数(50250)的10.57%
有效统计条件:
- 生日信息非空白
- 出生年份在1970 -1999(10-40岁)之间
- 生日不为1月1日(系统默认值)
=============================
图1:按用户编号(UID)分组的平均年龄及标准差 - 总体平均年龄为22.74岁,为大学毕业生年龄。比2008年第一次人口普查平均年龄22.1岁略有上升。
- 总体年龄标准差为3.87岁,相对较大,70.12%的会员年龄在平均值上下的一个标准差之内(18.86 - 26.61岁),约30%会员的年龄与平均值相差一个标准差以上。
- 随着用户编号(UID)的增加,平均年龄逐渐下降(24.45岁下降到18.72岁),新注册的用户(UID靠后)比老用户年轻得多。
=============================
图2:十二星座人数 - 摩羯座人数最多,水瓶座其次。这可能仍然与默认生日1月1日有关,不认真的用户很可能随便选择1月份的任何一天。
- 剔除默认生日的可能影响,人数较多的为天蝎座、天秤座和白羊座,金牛座和双子座相对较少。
=============================
图3:十二星座人数百分比
- 十二星座的比例分布较为均匀,差异不明显。
- 结果说明Key社作品并未对某些星座类型有特殊的吸引力,十二星座来到KeyFC的概率几乎相同。
=============================
图4:星座相性人数百分比- 按水火风地四相分类的星座仍然未体现明显差异。
=============================
图5:十二星座平均年龄 =============================
图6:十二星座性别保密及女生比例性别保密比例 = 性别为“保密”的人数 / 该星座总人数
女生比例 = 女生人数 / (该星座总人数 - 性别为“保密”的人数)
=============================
图7:十二星座人均发帖数 =============================
图8:十二星座人均积分 =============================
图9:十二星座人均在线时间(分钟) =============================
图10:十二星座人均注册、消失及活跃天数注册天数 = 2010年5月14日 - 注册日期
消失天数 = 2010年5月14日 - 最后访问日期
活跃天数 = 最后访问日期 - 注册日期
=============================
图11:十二星座人均好感度 =============================
图12:十二星座人均好人卡、学分、及精华帖 =============================
图13:十二星座人均会员信息完整度会员信息包括:
1. 个人网站
2. Email
3. ICQ
4. QQ
5. Yahoo
6. MSN
7. Skype
8. 来自
9. 头像
10. 个人简介
11. 签名
以上每填写一项,完整度+1。
会员信息完整度取值范围为0-11。
=============================
图14:十二星座人均真实信息完整度真实信息包括:
1. 姓名
2. 身份证号码
3. 手机
4. 电话
以上每填写一项,完整度+1。
真实信息完整度取值范围为0-4。
KeyFansClub不推荐会员在网上公开个人真实信息,本项目只为统计用。
=============================
表1:十二星座统计项目汇总“原始值”即以该项目原始单位计量的数值,如“女生比例”的计量单位为“百分比”,发帖数的计量单位为“个”,在线时间的计量单位为“分钟”。由于计量单位的差异,不同统计项目间无法比较。
“标准化值”即以该项目相距平均值的标准差个数为计量单位的数值,标准化值 = (该项目原始值 - 平均值)/ 标准差。由于统一了计量单位,不同统计项目间可以进行有意义的比较。
标准化值意义举例:
- 白羊座女生比例标准化值为-0.74:相对于十二星座平均水平,白羊座的女生比例低了0.74个标准差。
- 金牛座的发帖数、积分、在线分钟数标准化值分别为1.59、2.24、1.98:相对于十二星座平均水平,金牛座具有较高的发帖数、积分和在线时间。
标准差与平均值的关系根据切比雪夫不等式(Chebyshev's Inequality),对于
任意分布的数据,位于平均值m个标准差范围内的比例总是至少为1-1/㎡。
通常可解释为:
- 至少有3/4(75%)的数据位于平均值上下2个标准差范围内。
- 至少有8/9(89%)的数据位于平均值上下3个标准差范围内。
而对于
正态分布的数据(本统计中的大部分项目均近似符合正态分布):
- 至少有68%的数据位于平均值上下1个标准差范围内。
- 至少有95%的数据位于平均值上下2个标准差范围内。
- 至少有99%的数据位于平均值上下3个标准差范围内。
因此,如果数据距离平均值超过1个标准差,可认为差异明显;超过2个标准差, 可认为差异很大。如果超过3个标准差,可认为差异极端。
例如,水瓶座的好感度标准化值为2.65,可认为水瓶座的好感度显著超过十二星座平均水平。
=============================
图15:十二星座统计项目标准化值比较 =============================
图16:十二星座综合存在感标准化值比较表1的各星座统计项目标准化值统一了计量单位,为构建综合指数创作了条件。
为综合反映会员在KeyFC被感觉到“存在”的程度,可构建指数“综合存在感”:
综合存在感【原始值】 = 女生比例【标准化值】 + 发帖数【标准化值】 + 在线时间【标准化值】 + 注册天数【标准化值】-
消失天数【标准化值】+ 好感度【标准化值】 + 好人卡 【标准化值】 +
学分【标准化值】x 2 +
精华贴数【标准化值】x2 + 会员信息完整度【标准化值】
综合存在感【标准化值】= (综合存在感【原始值】 - 综合存在感【平均值】)/ 综合存在感【标准差】
综合存在感标准化值较高的星座具有:
- 较高的女生比例
- 较多的发帖数
- 较长的在线时间
- 较多的注册天数
- 较少的消失天数
- 较高的好感度
- 较多的好人卡
- 较多的学分和精华贴数(2倍加成计算)
- 较完整的会员信息
下图为各星座综合存在感【标准化值】的比较:
=============================
表2:十二星座精华贴数排名 总结本统计结果主要说明以下问题:
1. KeyFC会员年龄差距明显,最老的一批(UID 10000以内)和最新一批(UID 50000以上)有近6岁的差距,约30%的会员年龄与平均值(22.74岁)相差将近4岁,中学、大学、大学毕业三个年龄层次分明。
2. Key社作品对十二星座的吸引力几乎相同。曾有Key社作品专门吸引某种性格类型的说法,而星座与性格类型可能具有一定的关系,如火相星座较为热情奔放、土相星座较为内敛稳重等,因此可假设Key社作品会更多的吸引某些星座。但统计结果并不支持这个假设。
3. 坑
投票统计:我的星座是 —