Skip to content

[讨论] 是否能够接受在数据脱敏的情况下回传信息用来提高指纹准确度, 改进算法, 整理字典 #43

Description

@M09Ic

目前使用spray最大的困境可能还是没有一个很好的字典. 但制作字典除了手工整理之外几乎别无二法.

但如果使用spray的人足够多, spray可以通过收集部分数据来提高spray各方面的功能.

  • 提高指纹准确度, 筛选无效指纹
  • 改进过滤算法, 减少手动配置
  • 整理目录字典

因此, 是否能接受spray新增回传脱敏数据到云端的方式来提高工具本身. 为了保证安全, 可以做出以下保证.

  • 数据将会去掉目标部分(包括url, 跳转后的url, title), 只回传baseline基本信息(length, path, status), 指纹数据
  • 该功能可以通过参数关闭
  • 该功能的各个相关组件(包括云端部分)保持开源, 并通过github action自动编译
  • 收集的数据只用于提高spray以及chainreactors相关工具的能力

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type
    No fields configured for issues without a type.

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions