CN115940958A 审中 一种基于Fasta、Fastq生物大数据的压缩方法
本发明公开了一种基于Fasta、Fastq生物大数据的压缩方法,属于高压缩算法工具领域。包括以下步骤:S1、通过文件名后缀判定Fasta文件或者Fastq文件类型,解压文件并读取到内存中;S2、对Fasta文件或者Fastq文件进行分割处理,组成新的数组文件;S3、对新的数组文件进行代号字符数值分组和转换处理;S4、将转换以后的代号字符重新组成新的串,并进行替代存储,从而减少字符数量提高压缩率。本发明充分利用Fasta、Fastq数据格式的特征与计算机底层编码原理开展数据压缩算法与工具设计,采用基因碱基符号进行字符转换,以代号字符替换原有的碱基字符后再存储数据和进一步压缩。
More
澳门正版图库 Images(6)
专利时间轴
  • 22 Dec 2022 申请日
    CN/202211657980.3
    优先权
  • 22 Dec 2022 申请日
    CN/115940958
    当前专利 申请号
  • 07 Apr 2023 公开(公告)日期
    CN115940958A
    申请号
专利类型/受理局 APPLICATION( CN)
[标]当前申请(专利权)人 玉溪融建信息技术有限公司
当前申请(专利权)人 玉溪融建信息技术有限公司

653100 云南省玉溪市高新区南祥路22号二楼

[标]原始申请(专利权)人 玉溪融建信息技术有限公司
原始申请(专利权)人 玉溪融建信息技术有限公司

653100 云南省玉溪市高新区南祥路22号二楼

IPC分类号
IPC(8): H03M7/30G06F16/174 +2
技术主题分类
应用领域分类
发明人

李志达

郭涛

代理机构

北京华际知识产权代理有限公司 (唐海泉)

现在,一起体验智慧芽的产品和服务
自动注册,无需人工审核,即可立即开始查询专利
立即注册
澳门正版图库

AI助手