并且只一需要遍扫描,就可以知道匹配了哪个正则表达式,不需要类似 google.re2 中先预扫描得到候选,然后在候选集中匹配。这样的算法应该有应用价值吧,我现在已经有了思路。
--
---
您收到此邮件是因为您订阅了 Google 网上论坛的“TopLanguage”论坛。
要退订此论坛并停止接收此论坛的电子邮件,请发送电子邮件到 pongba+un...@googlegroups.com。
要查看更多选项,请访问 https://groups.google.com/groups/opt_out。
是要编译成一个 dfa, 但这不是靠说的, 算法很复杂, 目前只实现了简单的语法, 更复杂的语法现在还没有需求,以后有空再实现。不过还有一个问题DFA做不到,就是括号的捕获,现在是匹配以外的需求用其他的正则表达式库来做
你可以试一下 but when there is nothing left to take away
在拼华为之前,先拼个 GPU 版本的哈。
https://github.com/bkase/CUDA-grep.git
--
---
您收到此邮件是因为您订阅了 Google 网上论坛“TopLanguage”中的主题。
要退订此主题,请访问 https://groups.google.com/d/topic/pongba/ryu5NRVpv6U/unsubscribe。
要退订此论坛及其所有主题,请发送电子邮件到 pongba+un...@googlegroups.com。
要查看更多选项,请访问 https://groups.google.com/groups/opt_out。
--
---
您收到此邮件是因为您订阅了 Google 网上论坛的“TopLanguage”论坛。
要退订此论坛并停止接收此论坛的电子邮件,请发送电子邮件到 pongba+un...@googlegroups.com。
要查看更多选项,请访问 https://groups.google.com/groups/opt_out。
On Wed, Sep 04, 2013 at 07:02:37AM -0700, rockeet febird wrote:对这个有兴趣 能否借代码来学习下?
> 如果仅仅是多模匹配,我的自动机库中有AC(aho-corasick)自动机,底层的自动机实现可配置,基于双数组的实现匹配最快。几万个字符串时,单线程匹配速度轻轻松松一百兆。支持上千万个模式串也轻轻松松无压力