英语轻松读发新版了,欢迎下载、更新

怎么解读数据,尤其是中国的数据

xiaotie 发布于 2016年03月23日 | 更新于 2016年03月23日
tinyfool 等1人欣赏。

中国的数据千奇百怪,网上的数据更是变化万分,通过网上的数据去掌握真实,需要极高的技巧。俺有一套自己的方法论。

为了方便分析,这里把中国的官方数据分为四种:

第一种(A1)是一级一级申报的数据,这个水分巨大,比如,各个市县申报的XX行业增长率多高。

第二种(A2)是申报后,上面知道水分大的很,专门立项审计、核查的数据。比如说,统计局数据,大家都说统计局数据扯淡,一级级报上来的水分不小,但是,统计局还有另一套独立的数据调查渠道(10年前上经济分析选修课时老师讲的),正式公开的数据的准确度是经过修正过的。再比如,地方债,大家都知道问题很大,所以前一阵专门审计过。

我不知道大家有没被审计的经验,我们十多年前做国家项目,经历过两次审计,一次是学校审计,学校聘请会计师事务所进行第三方审计,平时开发票,没有注意,奸商给开的假发票都揪出来了。然后还不幸被审计署还是他NND统计局(忘了)抽查抽到了,又审计了一遍。做企业,我们现在是新三板挂牌,也是会计师事务所审计。审计时各项都要说清楚,都要有原始依据。审计过后的数据,水分是相当低的。即使有猫腻,也很难瞒住高手。这种数据是比较可信的。

第三种(A3)是个人申报的计算机中的数据。比如,二手房交易价格,为了少交税,很多人降低报价。这种数据是准确,但是不可信的。

第四种(A4)是严格监管的完全计算机化的数据。典型就是金融数据。存款数据、贷款数据,大额转账、证券登记,这些是准准确确记录在案的。财政数据,税务数据,也是真实准确记录在案的。

说完官方数据后,再说民间数据。企业数据也归于民间数据。

第一类(B1)是科研学者经过多年训练后,采用研究方法从官方数据中进行推断得到的数据。这种数据的商业目的少,具有一定的可信度,但受研究者水平限制,也可能会有较大的偏差;

第二类(B2)是研究机构里,具有一定资质的专业人士,在官方数据或自行调查的数据基础上,进行推断的数据。这类数据受研究者水平限制,又可能具有商业目的,出问题的可能性要更大一些。

第三类(B3)是即兴数据,媒体报道经常搞即兴数据,还有,个人演讲什么的,也不用负责任,断章取义、信口胡来满口跑火车的数据。典型如媒体上的报道,不幸碰到专业水平差的记者,看不出数据的问题,或者引用不全。。。

第四类(B4)是网友以讹传讹的数据。这是最烂的数据。。

第五类是对企业的审计统计数据(B5),这个是比较准确的。当然也可能有猫腻,但数据本身是对的。

第六类是企业的权威调查报告(B6),比如,制造业经理人采购指数。这个也是比较准确的。

网上数据,乱七八糟。上面从A1到A4,从B1到B6,网上都能找到,可谓互相矛盾,不会看数据的,一看就是,我TMD日了狗了,这大清国药丸 ……

下面讲讲怎么解读数据,解读这些乱七八糟的数据,我自己有些技巧和经验。

首先,明确个概念,什么是事实?

假如甲月薪1万元,他在2016年3月23日说他月薪2万元。“甲月薪2万元”,这不是事实。“甲在2016年3月23日说他月薪2万元”,这个陈述句是事实。

某个研究机构说中国地方政府债占中国GDP的245%,“中国地方政府债占中国GDP的245%”,这不是事实,“某个研究机构说中国地方政府债占中国GDP的245%”,这个陈述句是事实。

判断问题的基准只能是事实。

“某个地方政府公布XXXX上涨XXX”是事实,“某地方政府XXXX上涨XXX”不是事实。

但是,有些数据,XXXX公布XXXX,这个数据非常的权威,不存在造假的空间,我们会认为这个数据是事实。从这个角度来看,上面数据中,唯一的事实数据是A4类数据。另一类数据,不一定完全准确,但是经过大量的人力物力调查、审计,并且对真实性承担责任的数据,比如上面的A2,B5,B6。这一类数据经过第三方审计,存在造假风险,但是风险非常大,也可以用来做推断和决策。

其他的数据,比如,某某主体说出了甲乙丙数据,那么这个甲乙丙数据便不能认为是事实,只能将“某某主体说出了甲乙丙数据”当作事实。

从事实得出规律、推出结论有两个方法。方法1是逻辑推理。方法2是猜想反驳——假设、推理,由事实来反驳它。当然,社会数据很多情况没法搞猜想反驳,只能搞猜想证实,推出结论,从多方面来证实它,如果没有明显的矛盾事实存在,这得出的结果的可信度也比较大。

关于中国政府的债务问题,列出几个事实:

(1)目前中国个人、非金融机构的人民币贷款余额是90多万亿,外币贷款余额是记不清了,懒得重新查询了,貌似是6000多亿美刀,总计100万亿左右。

这是A4数据,最可信的数据。也就是所有人和非金融机构,除了私下借贷,这个贷款剩余额就是这个数据。中国社会融资余额貌似是140多万亿,也懒得查的了,也就是说,你从银行贷款10个亿,你再拿出6个亿以合法形式接待给另一方,那么这10个亿,还有6个亿,都记载这140多万亿里面。中国社会融资余额这个统计的比较晚,还不全面(也就漏了高利贷,通常推断是4-10万亿),但离真实数据差别不大。也就是说,中国的个人与非金融机构的融资余额跟这个数据差不远,其中的人民币贷款总额不会超过上面那个90多万亿(每笔贷款央行都记载着呢,不信去打印征信报告看看!)

(2)中国政府的专项审计,这是A2型数据。财政部副部长给的数据是政府债务是GDP的40%多。这个是审计后的结果,审计之前,到底是多少,财政部也不清楚。

下面开始交叉逻辑推理与猜想反驳(弱化为猜想证实)两个过程,玩一玩数据。

首先有一个大家都一致的结论:中国的融资以银行融资为主。具体占多少比例,关于地方债说是70%,央行统计是67.X%。90多万亿的银行贷款跟140多万亿的社会融资比例比一下,跟这边比例差不多。这就用事实类数据验证了这个比例数据。

再看政府的钱是怎么来的?中央政府主要是财政收支,所以比较清楚,数据也真实可靠。地方政府财务收支这个也非常可靠,都tmd能精确到分。

但是,地方政府在财政外,还有一笔帐。比如成立各种各样的城投公司啊,跟企业合作搞什么东东啊,通过这个平台从银行贷款。记住啊,这个负债实质上政府的债务,但是在形式上,是企业的债务!这也就是地方债搞不清楚,需要审计的地方。不审计,谁TMD也不知道这个企业贷款里,有多少是政府的马甲!

我们再看央行贷款数据。90多万亿人民币贷款余额中,20多万亿是个人和家庭贷款余额,抛弃这部分,简化点,还剩70万亿。这70多万亿,就是企业,还有地方政府的马甲的盘子。

我们按银行贷款占总的债务的70%来算,70万亿除以70%,是100万亿。去年GDP是67万亿,这100万亿是67万亿的150%。

当拍脑袋对外发表演讲时,你可以说中国企业的债务是GDP的150%,非常正确,完全没问题,因为地方政府的债务,主要也是通过他们的企业马甲来的嘛。

你也可以认为地方政府的债务是GDP的150%,这当然是扣屎盆子,谁让你NND 用马甲呢,那就全推到你身上。这屎盆子推不掉,只能说扣的太狠了。

好,我们就退一万步,假设这是真的。但是,你绝不能说,企业债务是GDP的150%,同时地方政府债务是GDP的150%,而只能是,这两个加起来是GDP的150%。如果你说,企业债务是GDP的150%,那么地方政府债务就是GDP的0%,如果你说,地方政府债务是GDP的150%,那么企业债务就是GDP的0%。

这下明白了吧,网上的这些数据几乎全TMD是扯淡,最靠近真相还就是财政部那个数据,也就是,政府债务大约占GDP的45%,企业债务占GDP的105%。这个是所有数据中最合理的数据。

下面,我们再来看,这样的事实是怎么来的 —— “XXX机构说中国企业债务占中国GDP的250%”。

假设你是XXX机构的分析员,你老板让你写份中国政府的债务分析(热点嘛!)你怎么写?自己去调查,这不是扯淡嘛。调查个毛啊!所以,只能是根据中国政府提供的数据来进行分析。

用央行数据来分析的,可能就得出企业债务占GDP的150%(但他没说,根据他的分析口径,地方政府的债务为零蛋呢!),然后,媒体就报道啦,XXX机构说,企业债务占GDP的XXX。然后又有家机构,研究说中国地方政府债务占GDP的100%或者再极端点150%(但他没说,这种统计下,企业债务就只占GDP的50%-0%了),然后,又有记者报道,政府债务占GDP的100%啦。不幸的你把两个数据都看到了,认为地方政府债务占GDP的100%,加上企业的150%,这就是250%,大清国药丸啦!!

这还是根据央行最真实的数据分析的呢。

还有更不靠谱的,根据财政部提供的国有企业资产负债表,把里面的负债当作债务。我在之前分析过几个公司报表,这个资产负债表里的负债,跟有偿债责任的债务不是一码事,前者大约是后者的1.5-2倍。

比如说啊,一个企业很强势,你先给我钱,我再给你发货。我收钱了,没发货,在资产负债表里,我收你的这笔钱是负债!但这不是债务,这笔钱越多,代表企业话语权越大,越NB!而不是表示这企业药丸!!

傻逼的分析员(或者自封的调查专家,实际为记者)如果用这个数据来分析,一看,我靠,国有企业负债就这么多了,还有非国企呢,针对所有企业来个放大,可不就成了企业负债占GDP的250%了!

你要是看到这个数据(企业负债占GDP的250%),再看到政府负债占GDP的150%,一加,GDP的400%了,岂不更觉得大清国药丸啦!!

买房,买茅房啊!!经济就快完蛋啦!然后眼睁睁看着买一套房的钱,最后只能买厕所了。

上面分析都是基于A4数据,然后辅以A2和B5数据,相互验证,看看是否矛盾。很遗憾,还没发现矛盾。当然精力有限,没法去做更深入的调查。

再扯远一点,谈谈数据的时效性问题。比如,“电脑辐射对孕妇有害”这个陈述,它是有时效性的。我专门查询了这个结论的出处,出自上世纪80年代的一个研究,那时电脑体积巨大,能塞下房间,这种电脑对孕妇有害。后来,很多人也做过研究,现在的这些电脑辐射,未发现对孕妇及胎儿危害的证据。所以说,“电脑辐射对孕妇有害”这句话正确表述应该是“上世纪80年代的电脑辐射对孕妇有害”。

(嘿嘿,删了闲话部分,留下可供反驳的部分)

共4条回复
tinyfool 回复于 2016年03月23日

写得太复杂了,你给个结论吧,我还不明白你的基础结论是啥

xiaotie 回复于 2016年03月23日

1楼 @tinyfool 结论就是央行数据是准确的,财政部数据不一定准确,但是是最靠近真实的数据,其他的和这矛盾的是扯淡的数据。不过这篇文章主要讲的是分析数据的方法而不是数据本身。

xiaotie 回复于 2016年03月23日

1楼 @tinyfool 再一个具体点的结论是:因为政府债务主要是通过政府旗下的投资公司这些来体现的,所以它在形式上也是企业债务。企业债务和政府债务总和是GDP的150%,你可以说企业债务是GDP的150%,也可以说政府债务是GDP的150%(0-150%,随便说,也没人纠责),但是绝不能说,企业债务是GDP的150%的同时,政府债务是GDP的150%,两个加起来是GDP的300%。咱们国家地方政府可是不能以政府名义贷款的啊!它的钱只能是财政钱、发债(这口子刚开,可以忽略不计),及通过企业马甲贷款。

xiaotie 回复于 2016年03月23日

顺便分析了那些乱七八糟的数据怎么产生的

登录 或者 注册