On 12月15日, 下午2时16分, est <electronix...@gmail.com> wrote:
> 恩。我知道这个东西可能一开始不会很技术,但是后面可以涉及到一个技术细节。
这个不是问题。任何传播都是先小众后大众的。
况且我发这个贴的目的又不是为了解决大规模公开传播问题的。我解决的是一个安全性和可靠性问题。
现有p2p的思路是512k一个数据块然后hash然后DHT。我这套方法,由于每个人切分离散规格和方法不一样,导致每个人的数据快都不一样,导致不可索引。也就没法p2p了。
除非每个人内存合并512k的数据块再切割再p2p,呵呵,麻烦了。
2009/12/15 翔李 <3qfr...@gmail.com>:
另外,审核的根本原因在于大众都开始获得信息,如果某个信息限制在小众里面,XX是不会审核的,而如果大规模使用的话,又会很快被发现的
如果是小众互传,随便加个密就行了,甚至winrar压缩加个密码,密码再另外告知就行了。
2009/12/15 jadedrip <jade...@gmail.com>:
2009/12/15 ribao wei <wrb...@gmail.com>:
数据和传输手段是中立的好不好。因为酸雨中也有H2O,每个人使用H2O都必须备案登记吗?
> 另外,审核的根本原因在于大众都开始获得信息,如果某个信息限制在小众里面,XX是不会审核的,而如果大规模使用的话,又会很快被发现的
请问怎么发现?
> 如果是小众互传,随便加个密就行了,甚至winrar压缩加个密码,密码再另外告知就行了。
这个加密码就好比一个明确攻击目标,只是盔甲比较厚而已。我这个方法就好比对付幽灵兵,物理攻击是无效的。
> 再者,这类问题,我觉得技术上能够做的是很有限的。好像tor项目的负责人说过,突破网络审查是一个社会性的问题,不是技术问题。
觉得党又出现了。
我现在的感觉是,这一次别低估上头构建世界上最大的局域网的决心。
2009/12/15 est <electr...@gmail.com>:
>
> 请问怎么发现?
>
--
《采莲》·江南
为卿采莲兮涉水,为卿夺旗兮长战。为卿遥望兮辞宫阙,为卿白发兮缓缓歌。
另抄自蒜头的评论:http://www.douban.com/review/1573456/:
且祭一束紫琳秋,为一段落花流水的传说
且饮一杯青花酒,为一场几多擦肩的错过
且焚一卷旖旎念,为一腔抛付虚无的惜怜
且歌一曲罢箜篌,为一刻良辰春宵的寂寞
>> 如果是小众互传,随便加个密就行了,甚至winrar压缩加个密码,密码再另外告知就行了。
>
> 这个加密码就好比一个明确攻击目标,只是盔甲比较厚而已。我这个方法就好比对付幽灵兵,物理攻击是无效的。
从你这个论断来说我可以说你对密码学不是很了解。
设计一个密码方案,就是要在公开加密机制,只保密密钥的情况下保证密文的安全性。
实际上你设计的也可以说是一种加密方案(实际上是相当简单的一种),相当于是取一个与明文等长的随机密钥,将密钥与明文异或得到密文。密文在于密钥异或就恢复得到明文。
让网络流无法被自动过滤,技术上太容易了。
突破网络审查,关键还是一个社会问题。
2009/12/15 est <electr...@gmail.com>:
lol,理论上密码学是多么多么安全,但是实际上,有2个问题你明显没有考虑到
1. 现有被证明的加密算法就那么几种,自己实现的的加密算法没有得到大多数人验证的情况下可以被认为是不安全的
2. 正如上一条所述,其实被加密的内容是一个很明显的target。相关破解的 research 也太多了。
最后,凭什么就不能在我所说这个分割之后对每一块数据再进行加密呢?
让网络流无法被自动过滤,技术上太容易了。这个的确,但是如果你的永久存储点被raid了之后,你加密的东西会让你强制交出密码,但是我这个方法处理之后的数据是可以抵赖的。
> 如果从流量分析记录发现当前无法分析的数据包比率有明显上升的趋势,我相信任何一个敏感的网管都会注意到这个问题。而且实际上它也不需要分析,封就是了,对他们而言不过就是黑名单里加一条记录,轻松愉快。
1. 大多数流量的数据包是无法分析的。否则世界上不会有这么多种类的过滤设备和安全公司了。
2.传统手段也可以被封吧。我这个方法只可能比传统方法更难发觉而不是跟容易被封。
况且我这个方法不是用来对抗gov的,是一种让互联网更加中立的手段
你的方案,实际上是一次一密,是信息论意义下绝对安全的加密方案。问题是效率问题。
说实话, with respect,跟你讨论这个问题有点跟以前大学门口那个拿了两页稿纸说自己证明了哥德巴赫猜想的“民间科学家”大叔讨论的感觉。
2009/12/15 est <electr...@gmail.com>:
理论上解释本来就是这个意思。我立了一个鸡蛋,你知道方法了之后当然觉得很弱智。
> 说实话, with respect,跟你讨论这个问题有点跟以前大学门口那个拿了两页稿纸说自己证明了哥德巴赫猜想的“民间科学家”大叔讨论的感觉。
再次向有理论高度的科班出生感觉党问好。
我想我没表达好我的意思。我不是说网管会试图从你的数据包
得到里面的信息。他只要确认最近有一段时间无法分析的包在增
加,就可以直接把你的站点加入黑名单,从而让你的一切努力毁
于一旦。从最近国内站点的整顿力度看,这么干并不是不可能的。
我也不是试图指出你打算对抗什么人,只是觉着你这方案最可能被
什么人注意而已,呵呵,就当是个建议吧。
没仔细想,但是显然LZ这个方案里,要分享文件,拆分数N必须是公开信息。所以:
(假设某人要分享一个长度m的文件,审查者,或者版权提供商手里有总长度为n的一堆文件是他们不愿意网民传播的)
(1)不加密的情况下,不需要全部下载N个文件就足够轻易审查你了
(2)且审查的复杂度貌似只有O(nm)?没时间仔细想,不确定是这个,不过我觉得只要你愿意想,真的能做出复杂的向当低的方法。因为我不需要知道你到
底是在分享蜗居还是奋斗,我只需要知道你分享了我不想你分享的东西。
(3)你当然可以先拆分再加密,但是因为N个块之间各自独立生成密文,且N依然是个公开信息,这样没有提高任何安全程度。
(4)先加密再拆分。这其实就是使得得到每个小段密文都可能源自N段明文,那不需要LZ劳神了,有更好的AES和DES了。
(5)关键是,反正你分享文件的时候要公开这个N出来,至少我个人永远不会用这个方案,而是会选择成熟的公钥加密算法。毕竟虽然慢点,但反正每个文件我
只计算一次,而且个人分享的东西嘛,其实就那么一点点。
Still I think this is more a social problem than a technical one.
2009/12/15 Yang Chi <neilyo...@gmail.com>:
Even Tor is too slow for most people. There is a paper explain why Tor
is so slow from an economic perspective.
2009/12/15 ribao wei <wrb...@gmail.com>:
1. 突破审查手段,必须用密码学吗?
2. 如果不用密码学,那么什么理论体系可以有效对抗审查?(我不想讨论对抗审查有多困难,动机之类的,只想知道how和其中原理)
3. 基于现有互联网架构,用什么方法最好?
2009/12/16 Mikster.Z <china...@gmail.com>:
政策面的复杂性就不说了
On Dec 15, 2:16 pm, est <electronix...@gmail.com> wrote:
> 恩。我知道这个东西可能一开始不会很技术,但是后面可以涉及到一个技术细节。
>
> 这个帖子最先发在TLF的tid=1411039,早年也在我的blog上(/641683)提到过
>
> 我们说网络内容审查,我想了下,大概有三种模式
>
> 一,传输过程中的关键词触发和过滤
> 二,已知存储位置和空间提供商位置,直接捣毁空间提供商
> 三,在大规模搜索引擎和索引服务提供商里,找到目标后迭代摧毁。
>
> 其实互联网体系架构是非常容易对抗这三种模式的。这就是下面要讨论的,让所有内容审核手段都很无语,让所有版权组织都哑口无言的数据分发手段,我把它命名为:c ontentless
> data transferring 去内容的数据传输
>
> 下面举1个非常简单容易理解例子说明我这个方法的思路
>
> 把一个电影文件的的所有字节,奇数位提取成一个单独文件 a.bin 放在rayfile,偶数位提取出 b.bin
> 放在rapidshare。这里的rayfile和
> rapidshare都是知名网盘。用户同时从rayfile和rapidshare下载,下载完毕之后合并文件得到完整原始电影。但是从rayfile和ra pidshare的角度来看这两个文件都是未知的二进制流而没有任何意义的。这里只是划分成2块,我们还可以划分成4块、8块的。
>
> 就好比,我们说贩卖武器是非法的,但是贩卖可以用于制造武器的原料铁矿石,和冶炼、金工制造、组装技术是分别合法的。而且审查机制又不可能为了禁止武器而捣毁所 有冶炼厂和金工厂。
>
> 为什么可以对抗上面提到的三种内容审核?我们逐个分析:
>
> 1.
> 除非是上传者终端和下载着终端,传输过程中的任意peer是不可能得到所有数据块的。即使得到所有数据块,要研究出如何组装还原也是相当麻烦复杂的。这里就需要 对所有捕获到的数据包进行排列组合和矩阵变换验证匹配。大家可以想像一下这里的计算量是相当大的。更不要说,万一我对每一个数据包都有不同程度的加密和混淆
> 2.
> 这里空间提供商和永久存储服务提供商是免责的。因为保存在单个位置的数据是不完整也是不可知的。所以空间提供商不不可能提前扫描探测内容性质而作出预先屏蔽。所 以最多就是事后删除文件。
> 3.
> 这里的分发所有保存位置和如何下载的帖子做到传统小众、隐蔽和低调即可。最重要的就是索引贴不要被google等搜索引擎爬虫了。而且文件上传起名也要模糊。
>
> 可能大家会问这个方法和传统文件分块有什么不同,其关键就在于,还是拿电影文件做例子,传统文件分割,假如电影版被分为上下两端,每一段修复文件头了之后,虽然 是部分,但是仍然可以作为盗版的直接证据。因为审核手段最小单位是
> byte ,你的分割最小单位也是byte。但是如果分割的最小单位是 bit,那么审核就没有办法了。
>
> 普通文本数据关键字审核也是同理的。从 bit 开始分割就破坏了组成内容的基本原子单位,而把数据纯流量化了。
>
> 这里涉及到的算法叫 Information Dispersal Algorithms
> (IDA)。IDA最典型的用途就是硬盘组建raid5。最简单的IDA就是上面提到奇偶分块,复杂的IDA可以涉及到矩阵变换
>
> 总结下这个方法的好处:
>
> 1. 空间提供商和永久存储服务提供商是免责的,也是可以抵赖的。
> 2. 上传/下载/分发速度大大提高。上传下载都是并发的,分2快就最高可以提速2倍了。(除非带宽限制)
> 3. 数据可以做类似raid5那样的容错校验。例如上传到8个点,其中任意2个点的数据被删除,仍然可以还原得到完整文件。
>
> 后续开发:
>
> 1. 还是拿电影作为例子,还是假设我们把文件分成两块。其实我们下载得到的 a.bin 和 b.bin
> 没有必要在硬盘上合并再播放了,播放器应该直接提供这样的机制:同时从两个文件读取buffer然后playback。做到这一点也不难。播放效率和普通音视频 文件也没有太大差别。如果两个文件保存位置不一样,例如一个在网上邻居一个在本地硬盘,那么播放速度还可以最多提高2倍。
>
> 2.
> 单文件,不用事先分割,而由程序直接上传直接得到多个下载点。和上面播放器的例子相反,从一个单一文件读取buffer,直接在内存里分离成多块然后上传到不同 地点。
>
> 3. 安全的云存储。现在云计算最大的一个关心就是隐私问题。很多中小企业把商业文档都保存在Google
> Docs(国外),那么对于Google角度来说这个内容是完全掌握可以分析的。假如只需要在云里保存数据,而不是计算的话,我们完全可以把一份文档分割成3块 ,一块放Google,一块放Amazon
> S3,一块放Dropbox,因为三家空间提供商不是互通的,所以我的内容是绝对安全的。
>
> 其实这个思路的起源就是一个简单的思想:把内容和流量分离开来。流量是内容无关的。这也是contentless
> data transferring里contentless的精髓。现在互联网最严重的审查机制都是因为内容引起的,特别是早期互联网协议,都是明文的,谁都可以来拦截 篡改一下。如果最后协议也做到去内容化,甚至连握手都去内容化,那么互联网就是不可审查的了。或者说审查的成本非常高,你需要强制手段接管所有接入互联网的国家 ,并且直接控制每一个互联网使用者。
On Dec 15, 2:16 pm, est <electronix...@gmail.com> wrote:
> 恩。我知道这个东西可能一开始不会很技术,但是后面可以涉及到一个技术细节。
>
> 这个帖子最先发在TLF的tid=1411039,早年也在我的blog上(/641683)提到过
>
> 我们说网络内容审查,我想了下,大概有三种模式
>
> 一,传输过程中的关键词触发和过滤
> 二,已知存储位置和空间提供商位置,直接捣毁空间提供商
> 三,在大规模搜索引擎和索引服务提供商里,找到目标后迭代摧毁。
>
> 其实互联网体系架构是非常容易对抗这三种模式的。这就是下面要讨论的,让所有内容审核手段都很无语,让所有版权组织都哑口无言的数据分发手段,我把它命名为:contentless
> data transferring 去内容的数据传输
>
> 下面举1个非常简单容易理解例子说明我这个方法的思路
>
> 把一个电影文件的的所有字节,奇数位提取成一个单独文件 a.bin 放在rayfile,偶数位提取出 b.bin
> 放在rapidshare。这里的rayfile和
> rapidshare都是知名网盘。用户同时从rayfile和rapidshare下载,下载完毕之后合并文件得到完整原始电影。但是从rayfile和rapidshare的角度来看这两个文件都是未知的二进制流而没有任何意义的。这里只是划分成2块,我们还可以划分成4块、8块的。
>
> 就好比,我们说贩卖武器是非法的,但是贩卖可以用于制造武器的原料铁矿石,和冶炼、金工制造、组装技术是分别合法的。而且审查机制又不可能为了禁止武器而捣毁所有冶炼厂和金工厂。
>
> 为什么可以对抗上面提到的三种内容审核?我们逐个分析:
>
> 1.
> 除非是上传者终端和下载着终端,传输过程中的任意peer是不可能得到所有数据块的。即使得到所有数据块,要研究出如何组装还原也是相当麻烦复杂的。这里就需要对所有捕获到的数据包进行排列组合和矩阵变换验证匹配。大家可以想像一下这里的计算量是相当大的。更不要说,万一我对每一个数据包都有不同程度的加密和混淆
> 2.
> 这里空间提供商和永久存储服务提供商是免责的。因为保存在单个位置的数据是不完整也是不可知的。所以空间提供商不不可能提前扫描探测内容性质而作出预先屏蔽。所以最多就是事后删除文件。
> 3.
> 这里的分发所有保存位置和如何下载的帖子做到传统小众、隐蔽和低调即可。最重要的就是索引贴不要被google等搜索引擎爬虫了。而且文件上传起名也要模糊。
>
> 可能大家会问这个方法和传统文件分块有什么不同,其关键就在于,还是拿电影文件做例子,传统文件分割,假如电影版被分为上下两端,每一段修复文件头了之后,虽然是部分,但是仍然可以作为盗版的直接证据。因为审核手段最小单位是
> byte ,你的分割最小单位也是byte。但是如果分割的最小单位是 bit,那么审核就没有办法了。
>
> 普通文本数据关键字审核也是同理的。从 bit 开始分割就破坏了组成内容的基本原子单位,而把数据纯流量化了。
>
> 这里涉及到的算法叫 Information Dispersal Algorithms
> (IDA)。IDA最典型的用途就是硬盘组建raid5。最简单的IDA就是上面提到奇偶分块,复杂的IDA可以涉及到矩阵变换
>
> 总结下这个方法的好处:
>
> 1. 空间提供商和永久存储服务提供商是免责的,也是可以抵赖的。
> 2. 上传/下载/分发速度大大提高。上传下载都是并发的,分2快就最高可以提速2倍了。(除非带宽限制)
> 3. 数据可以做类似raid5那样的容错校验。例如上传到8个点,其中任意2个点的数据被删除,仍然可以还原得到完整文件。
>
> 后续开发:
>
> 1. 还是拿电影作为例子,还是假设我们把文件分成两块。其实我们下载得到的 a.bin 和 b.bin
> 没有必要在硬盘上合并再播放了,播放器应该直接提供这样的机制:同时从两个文件读取buffer然后playback。做到这一点也不难。播放效率和普通音视频文件也没有太大差别。如果两个文件保存位置不一样,例如一个在网上邻居一个在本地硬盘,那么播放速度还可以最多提高2倍。
>
> 2.
> 单文件,不用事先分割,而由程序直接上传直接得到多个下载点。和上面播放器的例子相反,从一个单一文件读取buffer,直接在内存里分离成多块然后上传到不同地点。
>
> 3. 安全的云存储。现在云计算最大的一个关心就是隐私问题。很多中小企业把商业文档都保存在Google
> Docs(国外),那么对于Google角度来说这个内容是完全掌握可以分析的。假如只需要在云里保存数据,而不是计算的话,我们完全可以把一份文档分割成3块,一块放Google,一块放Amazon
> S3,一块放Dropbox,因为三家空间提供商不是互通的,所以我的内容是绝对安全的。
>
> 其实这个思路的起源就是一个简单的思想:把内容和流量分离开来。流量是内容无关的。这也是contentless
> data transferring里contentless的精髓。现在互联网最严重的审查机制都是因为内容引起的,特别是早期互联网协议,都是明文的,谁都可以来拦截篡改一下。如果最后协议也做到去内容化,甚至连握手都去内容化,那么互联网就是不可审查的了。或者说审查的成本非常高,你需要强制手段接管所有接入互联网的国家,并且直接控制每一个互联网使用者。
这的确从技术的角度上来说能达到传输文件内容的不可知性。但是,从我们现实的屏蔽方法来说,这样破解我国的屏蔽是不可行的。因为现实的屏蔽很大程度上是
非“技术性”屏蔽。
在我国,很多的内容审查并非纯技术的上的审查,我想大多数应该是基于技术+人工的审查方式。也就是说,无数的小众长尾可以通过技术手段屏蔽,但一旦玩大
了玩出名了即使技术屏蔽不了,通过人工审查依旧可以人工屏蔽掉。这才是无解的地方。
举例说,可以在海外建一个小网站,通过技术手段逃过屏蔽,没问题。但是有一天访问量达到某个高度,即使你只踏入过一步雷池,也会给墙掉。
也就是说,我个人认为,所有的技术手段只能针对小众,一旦普及开来,审查是肯定的。比如楼主提到的空间提供商免责,我想,再怎么免责,一旦这个渠道普及
化,要墙你也是分分钟的事。
至于审查成本的问题,我不知道具体怎么操作的,但是我想审查成本的高低取决于使用者获取信息过程成本的高低。假如所有网民都是程序员,大家都有强悍的数
据获取能力,那审查的成本将同比例上升。可是现实是,审查面向你,但不针对你,而是针对大众。
On 12月15日, 下午2时16分, est <electronix...@gmail.com> wrote:
> 恩。我知道这个东西可能一开始不会很技术,但是后面可以涉及到一个技术细节。
>
> 这个帖子最先发在TLF的tid=1411039,早年也在我的blog上(/641683)提到过
>
> 我们说网络内容审查,我想了下,大概有三种模式
>
> 一,传输过程中的关键词触发和过滤
> 二,已知存储位置和空间提供商位置,直接捣毁空间提供商
> 三,在大规模搜索引擎和索引服务提供商里,找到目标后迭代摧毁。
>
> 其实互联网体系架构是非常容易对抗这三种模式的。这就是下面要讨论的,让所有内容审核手段都很无语,让所有版权组织都哑口无言的数据分发手段,我把它命名为:c ontentless
> data transferring 去内容的数据传输
>
> 下面举1个非常简单容易理解例子说明我这个方法的思路
>
> 把一个电影文件的的所有字节,奇数位提取成一个单独文件 a.bin 放在rayfile,偶数位提取出 b.bin
> 放在rapidshare。这里的rayfile和
> rapidshare都是知名网盘。用户同时从rayfile和rapidshare下载,下载完毕之后合并文件得到完整原始电影。但是从rayfile和ra pidshare的角度来看这两个文件都是未知的二进制流而没有任何意义的。这里只是划分成2块,我们还可以划分成4块、8块的。
>
> 就好比,我们说贩卖武器是非法的,但是贩卖可以用于制造武器的原料铁矿石,和冶炼、金工制造、组装技术是分别合法的。而且审查机制又不可能为了禁止武器而捣毁所 有冶炼厂和金工厂。
>
> 为什么可以对抗上面提到的三种内容审核?我们逐个分析:
>
> 1.
> 除非是上传者终端和下载着终端,传输过程中的任意peer是不可能得到所有数据块的。即使得到所有数据块,要研究出如何组装还原也是相当麻烦复杂的。这里就需要 对所有捕获到的数据包进行排列组合和矩阵变换验证匹配。大家可以想像一下这里的计算量是相当大的。更不要说,万一我对每一个数据包都有不同程度的加密和混淆
> 2.
> 这里空间提供商和永久存储服务提供商是免责的。因为保存在单个位置的数据是不完整也是不可知的。所以空间提供商不不可能提前扫描探测内容性质而作出预先屏蔽。所 以最多就是事后删除文件。
> 3.
> 这里的分发所有保存位置和如何下载的帖子做到传统小众、隐蔽和低调即可。最重要的就是索引贴不要被google等搜索引擎爬虫了。而且文件上传起名也要模糊。
>
> 可能大家会问这个方法和传统文件分块有什么不同,其关键就在于,还是拿电影文件做例子,传统文件分割,假如电影版被分为上下两端,每一段修复文件头了之后,虽然 是部分,但是仍然可以作为盗版的直接证据。因为审核手段最小单位是
> byte ,你的分割最小单位也是byte。但是如果分割的最小单位是 bit,那么审核就没有办法了。
>
> 普通文本数据关键字审核也是同理的。从 bit 开始分割就破坏了组成内容的基本原子单位,而把数据纯流量化了。
>
> 这里涉及到的算法叫 Information Dispersal Algorithms
> (IDA)。IDA最典型的用途就是硬盘组建raid5。最简单的IDA就是上面提到奇偶分块,复杂的IDA可以涉及到矩阵变换
>
> 总结下这个方法的好处:
>
> 1. 空间提供商和永久存储服务提供商是免责的,也是可以抵赖的。
> 2. 上传/下载/分发速度大大提高。上传下载都是并发的,分2快就最高可以提速2倍了。(除非带宽限制)
> 3. 数据可以做类似raid5那样的容错校验。例如上传到8个点,其中任意2个点的数据被删除,仍然可以还原得到完整文件。
>
> 后续开发:
>
> 1. 还是拿电影作为例子,还是假设我们把文件分成两块。其实我们下载得到的 a.bin 和 b.bin
> 没有必要在硬盘上合并再播放了,播放器应该直接提供这样的机制:同时从两个文件读取buffer然后playback。做到这一点也不难。播放效率和普通音视频 文件也没有太大差别。如果两个文件保存位置不一样,例如一个在网上邻居一个在本地硬盘,那么播放速度还可以最多提高2倍。
>
> 2.
> 单文件,不用事先分割,而由程序直接上传直接得到多个下载点。和上面播放器的例子相反,从一个单一文件读取buffer,直接在内存里分离成多块然后上传到不同 地点。
>
> 3. 安全的云存储。现在云计算最大的一个关心就是隐私问题。很多中小企业把商业文档都保存在Google
> Docs(国外),那么对于Google角度来说这个内容是完全掌握可以分析的。假如只需要在云里保存数据,而不是计算的话,我们完全可以把一份文档分割成3块 ,一块放Google,一块放Amazon
> S3,一块放Dropbox,因为三家空间提供商不是互通的,所以我的内容是绝对安全的。
>
> 其实这个思路的起源就是一个简单的思想:把内容和流量分离开来。流量是内容无关的。这也是contentless
> data transferring里contentless的精髓。现在互联网最严重的审查机制都是因为内容引起的,特别是早期互联网协议,都是明文的,谁都可以来拦截 篡改一下。如果最后协议也做到去内容化,甚至连握手都去内容化,那么互联网就是不可审查的了。或者说审查的成本非常高,你需要强制手段接管所有接入互联网的国家 ,并且直接控制每一个互联网使用者。
On 12月16日, 上午4时51分, est <electronix...@gmail.com> wrote:
> > 从你这个论断来说我可以说你对密码学不是很了解。设计一个密码方案,就是要在公开加密机制,只保密密钥的情况下保证密文的安全性。
>
> lol,理论上密码学是多么多么安全,但是实际上,有2个问题你明显没有考虑到
>
> 1. 现有被证明的加密算法就那么几种,自己实现的的加密算法没有得到大多数人验证的情况下可以被认为是不安全的
> 2. 正如上一条所述,其实被加密的内容是一个很明显的target。相关破解的 research 也太多了。
>
> 最后,凭什么就不能在我所说这个分割之后对每一块数据再进行加密呢?
>
> 让网络流无法被自动过滤,技术上太容易了。这个的确,但是如果你的永久存储点被raid了之后,你加密的东西会让你强制交出密码,但是我这个方法处理之后的数据 是可以抵赖的。
>
> > 如果从流量分析记录发现当前无法分析的数据包比率有明显上升的趋势,我相信任何一个敏感的网管都会注意到这个问题。而且实际上它也不需要分析,封就是了,对他们 而言不过就是黑名单里加一条记录,轻松愉快。
On Dec 15, 3:34 pm, est <electronix...@gmail.com> wrote:
> 恩。我这个思路是反p2p的。
>
> 现有p2p的思路是512k一个数据块然后hash然后DHT。我这套方法,由于每个人切分离散规格和方法不一样,导致每个人的数据快都不一样,导致不可索引。-也就没法p2p了。
>
> 除非每个人内存合并512k的数据块再切割再p2p,呵呵,麻烦了。
>
> 2009/12/15 翔李 <3qfri...@gmail.com>:
>
>
>
> > 有点脱离P2P思想,如果是放在服务器的话,服务器不知情,当然么关系,但是这样就不能规模化。规模化,必须是别人知情,但是没法办你。- Hide quoted text -
>
> - Show quoted text -
2009/12/16 est <electr...@gmail.com>:
如果这些都是OK得,那么很简单,只要用类似google的工具查询热门电影关键字并统计流量(这个监管部门很容易做到)就好了,然后就会去查你又没有这些电影的授权,如果没有就封了。
如果是封闭的又如何?比如小众之间互通有无,直接用P2p传输,不过我想这样的话用qq或skype的群传输就可以了吧,也不需要再发明一次。如果信不过商业公司,那么多开源的的软件,自己编译一个也可以吧,只不过要大家都用就比较复杂。
2009/12/16 est <electr...@gmail.com>:
keys是下次解码用的base64的key排列
每发送一段数据 随机生成一次key排列
这样一段通讯内 它没法中途截获你
大家考虑问题都考虑那么弱 or 那么学术化么?
2009/12/18 张鹏程 <holme...@gmail.com>:
哎。。。我前面已经声明了无穷多次了哎。。。这个要靠分层组织化+人海战术。这个传统手段就可以让审查手段去死了。
大家考虑问题都考虑那么弱 or 那么学术化么?
>> 我们说网络内容审查,我想了下,大概有三种模式
2009/12/28 zhaoren liu <php...@gmail.com>:
http://en.wikipedia.org/wiki/Monolith_(computer_program)
http://lawmeme.research.yale.edu/modules.php?name=News&file=article&sid=1487
http://ansuz.sooke.bc.ca/lawpoli/colour/2004061001.php
其中plausible deniability和liability是这套方法的初衷。大家都想得太远了,呵呵。
2009/12/15 est <electr...@gmail.com>:
> 恩。我知道这个东西可能一开始不会很技术,但是后面可以涉及到一个技术细节。
> 这个帖子最先发在TLF的tid=1411039,早年也在我的blog上(/641683)提到过
> 我们说网络内容审查,我想了下,大概有三种模式
> 一,传输过程中的关键词触发和过滤
> 二,已知存储位置和空间提供商位置,直接捣毁空间提供商
> 三,在大规模搜索引擎和索引服务提供商里,找到目标后迭代摧毁。
> 其实互联网体系架构是非常容易对抗这三种模式的。这就是下面要讨论的,让所有内容审核手段都很无语,让所有版权组织都哑口无言的数据分发手段,我把它命名为:contentless
> data transferring 去内容的数据传输
> 下面举1个非常简单容易理解例子说明我这个方法的思路
> 把一个电影文件的的所有字节,奇数位提取成一个单独文件 a.bin 放在rayfile,偶数位提取出 b.bin
> 放在rapidshare。这里的rayfile和
> rapidshare都是知名网盘。用户同时从rayfile和rapidshare下载,下载完毕之后合并文件得到完整原始电影。但是从rayfile和rapidshare的角度来看这两个文件都是未知的二进制流而没有任何意义的。这里只是划分成2块,我们还可以划分成4块、8块的。
> 就好比,我们说贩卖武器是非法的,但是贩卖可以用于制造武器的原料铁矿石,和冶炼、金工制造、组装技术是分别合法的。而且审查机制又不可能为了禁止武器而捣毁所有冶炼厂和金工厂。
> 为什么可以对抗上面提到的三种内容审核?我们逐个分析:
> 1.
> 除非是上传者终端和下载着终端,传输过程中的任意peer是不可能得到所有数据块的。即使得到所有数据块,要研究出如何组装还原也是相当麻烦复杂的。这里就需要对所有捕获到的数据包进行排列组合和矩阵变换验证匹配。大家可以想像一下这里的计算量是相当大的。更不要说,万一我对每一个数据包都有不同程度的加密和混淆
> 2.
> 这里空间提供商和永久存储服务提供商是免责的。因为保存在单个位置的数据是不完整也是不可知的。所以空间提供商不不可能提前扫描探测内容性质而作出预先屏蔽。所以最多就是事后删除文件。
> 3.
> 这里的分发所有保存位置和如何下载的帖子做到传统小众、隐蔽和低调即可。最重要的就是索引贴不要被google等搜索引擎爬虫了。而且文件上传起名也要模糊。
> 可能大家会问这个方法和传统文件分块有什么不同,其关键就在于,还是拿电影文件做例子,传统文件分割,假如电影版被分为上下两端,每一段修复文件头了之后,虽然是部分,但是仍然可以作为盗版的直接证据。因为审核手段最小单位是
> byte ,你的分割最小单位也是byte。但是如果分割的最小单位是 bit,那么审核就没有办法了。
> 普通文本数据关键字审核也是同理的。从 bit 开始分割就破坏了组成内容的基本原子单位,而把数据纯流量化了。
> 这里涉及到的算法叫 Information Dispersal Algorithms
> (IDA)。IDA最典型的用途就是硬盘组建raid5。最简单的IDA就是上面提到奇偶分块,复杂的IDA可以涉及到矩阵变换
> 总结下这个方法的好处:
> 1. 空间提供商和永久存储服务提供商是免责的,也是可以抵赖的。
> 2. 上传/下载/分发速度大大提高。上传下载都是并发的,分2快就最高可以提速2倍了。(除非带宽限制)
> 3. 数据可以做类似raid5那样的容错校验。例如上传到8个点,其中任意2个点的数据被删除,仍然可以还原得到完整文件。
> 后续开发:
> 1. 还是拿电影作为例子,还是假设我们把文件分成两块。其实我们下载得到的 a.bin 和 b.bin
> 没有必要在硬盘上合并再播放了,播放器应该直接提供这样的机制:同时从两个文件读取buffer然后playback。做到这一点也不难。播放效率和普通音视频文件也没有太大差别。如果两个文件保存位置不一样,例如一个在网上邻居一个在本地硬盘,那么播放速度还可以最多提高2倍。
> 2.
> 单文件,不用事先分割,而由程序直接上传直接得到多个下载点。和上面播放器的例子相反,从一个单一文件读取buffer,直接在内存里分离成多块然后上传到不同地点。
> 3. 安全的云存储。现在云计算最大的一个关心就是隐私问题。很多中小企业把商业文档都保存在Google
> Docs(国外),那么对于Google角度来说这个内容是完全掌握可以分析的。假如只需要在云里保存数据,而不是计算的话,我们完全可以把一份文档分割成3块,一块放Google,一块放Amazon
> S3,一块放Dropbox,因为三家空间提供商不是互通的,所以我的内容是绝对安全的。
> 其实这个思路的起源就是一个简单的思想:把内容和流量分离开来。流量是内容无关的。这也是contentless
> data transferring里contentless的精髓。现在互联网最严重的审查机制都是因为内容引起的,特别是早期互联网协议,都是明文的,谁都可以来拦截篡改一下。如果最后协议也做到去内容化,甚至连握手都去内容化,那么互联网就是不可审查的了。或者说审查的成本非常高,你需要强制手段接管所有接入互联网的国家,并且直接控制每一个互联网使用者。
Tangler: A Censorship-Resistant Publishing System Based On Document
Entanglements
http://www.scs.stanford.edu/~dm/home/papers/waldman:tangler-large.pdf
看来哲学上,censorship主要和publicity有关 :)
2010/1/9 est <electr...@gmail.com>: