RS(255,223)纠错算法原理


RS(255,223)纠错算法原理与项目源码

##1.背景

  • 数据在网络传输、存储过程中由于信道噪声条件,硬件设备等问题数据产生了差错,这时候应该如何处理呢?特别是现在企业对海量大数据的传输,存储的重视,要求我们使用一定的技术处理这些数据差错。
    ##2.纠错编解码原理简单介绍

  • 为什么纠错码具有发现错误!纠正错误的能力呢?纠错码又是按什么样的原理去编的呢?为了说明这些问题,我们首先介绍一些基本概念:由0和1组成的串称为字(Word),一些字的集合称为码(Code)。码中的字称为码字(Code Word)。不在码中的字称为废码(Invalid Code)。码中的每个二进制信号0或1称为码元(Code Letter)。

  • 我们下面举出几个关于纠错码的例子。设有长度为2的字,它们一共可有2x2=4个,力。因为当52中的一个字如10,在传递过程中其第一个码元1变为0,因而整个字成为00时,由于00也是52中的字,故我们不能发现传递中是否出错。但是,当我们选取52的一个子集如C2={00},作为编码时就会发生另一种完全不同的情况。因为此时01和10均为废码,而当H在传递过程中第一个码元由1变为0,即整个字成为01时,由于01是废码,因而我们发现传递过程中出现了错误。对00也有同样的情况。但是,这种编码有一个缺点,即它只能发现错误而不能纠正错误,因此我们还需要选择另一种能纠错的编码”现在我们考虑长度为3的字,它们一共可有2!3=8个,它们所组成的字集凡不仅能整个码字只会变为101!011或000,但是都可知其原码为001。对于码字110也有类似的情况”故对编码q,我们不仅能发现错误而且能纠正错误”当然,上述编码还有一个缺点,就是它只能发现并纠正单个错误。当错误超过两个码元时,它就既不能发现错误,更无法纠正了。
    ##3.Reed-Solomon 码(RS 码)原理

  • Reed-Solomon 码(RS 码)是 Reed和 Solomon于 1960 年发现的一类多元最大距离可分(MDS)码,其最小距离达到了 Singleton 限mind = n − k+ 1,从这个意义上讲,RS 码是最佳的。之后几十年里,RS 码的硬判决译码得到了深入的研究,其理论和技术都已经非常成熟。因而,RS码在现代数字通信、数据存储系统中得到了广泛的应用。
    ##4.Reed – Solomon编码抽象代数基础

  • 4.1定义 设G是一个非空集合,称映射为G上的一个二元运算,即对于G中仍以两个元a和b,唯一确定 (a,b).记为,为了方便起见,可写成c=ab.
    定义 设G是一个非空集合,是G上的一个二元运算,如果G满足下列条件:
    a)(结合律)对于任意,有
    b)(单位元)G中存在单位元,对于任意,满足
    c)(逆元)对于任意,存在的逆元,满足
    则称G为群,记为.
    如果群满足交换律,即对于任意,满足
    则称群 为交换群或阿贝尔群.

  • 4.2 环和域
    定义 设R是一个非空集合,R上有两个二元运算和,分别成为加法和乘法,如果R满足下列条件
    a)为加法阿贝尔群
    b)(结合律)对于任意,有
    c)(分配律)对于任意,有
    称R为环,记为,如果他对乘法满足交换律,即对任何
    称环为交换环
    定义 设为交换环,表示R中所有非零元的集合,如果在乘法运算下构成交换群,则称为域。

  • 4.3 有限域
    定义 设F为一个域,如果F只含有有限个元素,称F为有限域,含有q个元素的有限域记为,有限域也成为伽罗华域(Galois field),用GF(q)或表示q阶有限域。
    最简单的有限域是二元域GF(2)={0,1}。
    定义 对于GF(q)上的每个非零元素,存在最小整数k,使成立,则称为k阶元素。
    定义 对于GF(q)上的每个非零元素,如果其阶数是q-1,则称为本原元素。
    定义上的一个m次多项式,如果他的所有根都是中的本原元素,则称是m次本原多项式。
    例如,对于m = 8时上的m次本原多项式为
    对于m = 7时上的m次本原多项式为
    定义 设为中的元素,多项式是上使的最低次多项式,则称为最小多项式。具有相同最小多项式的元素,构成同一共轭系。

  • 4.4 欧几里得算法
    欧几里得算法给定两个正整数a,b,可以用欧几里得除法得到其最大公约数(a,b),并求得A,B,满足(a,b)=Aa+Bb。
    用欧几里得除法求(a,b)的步骤如下:
    第一步:不失一般性,假设a>b,且令
    第二步:用除以得到其商数和余数,亦即
    第三步:如果,停止运算,并记;否则,转第二步。
    欧几里得算法又被称为辗转相除法,这里是单调下降序列。
    用欧几里得算法可以求得A、B,沿用上述除法得到的和n,其方法如下:
    第一步:令
    第二步:计算
    第三步:如果,停止运算,此时,否则转第二步
    事实上,只是其中的一个特例。
    ##5.RS(255,223)编解码算法

  • 5.1字节交织器
    这里写图片描述
    这里写图片描述

  • 5.2 RS(255,223,32)生成方式
    这里写图片描述
    这里写图片描述
    ##Github项目源码

  • GitHub链接: https://github.com/RobinLiew/Reed-Solomon-error-correction

  • 使用例子

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    public class RSErrorCorrectionImpl implements IRSErrorCorrection {


    private RSEncoder encoder=new RSEncoder();

    private RSDecoder decoder=new RSDecoder();

    public static Boolean isCanBeRecovered=true;

    private byte[] temp=new byte[233];

    private ByteBuffer buffer=new ByteBuffer() ;

    private byte[] enTemp=new byte[255];

    public byte[] rs_encode(byte[] data) {
    return encoder.encode(data);
    }

    public int rs_decode(byte[] recover, byte[] rsData) {
    byte[] result = null;
    result=decoder.decode(rsData);

    if(!isCanBeRecovered){
    return 1;
    }
    System.arraycopy(result, 0, recover, 0, result.length);
    return 0;
    }

    public static void main(String[] args){

    byte[] src=new byte[223];
    for(int i=0;i<223;i++){
    src[i]=(byte) new Random().nextInt(255);
    }
    byte[] srcdouble=new byte[446];
    for(int i=0;i<2;i++){
    System.arraycopy(src, 0, srcdouble, i*223, 223);
    }

    IRSErrorCorrection error = new RSErrorCorrectionImpl();
    byte[] en_data=error.rs_encode(srcdouble);

    //Deliberately mistaken the values of several data(故意弄错几个数据的值)
    en_data[0]=0;
    en_data[1]=4;
    en_data[3]=0;
    //byte[] recover = new byte[src.length];
    byte[] recover = new byte[srcdouble.length];
    int flag = error.rs_decode(recover,en_data);


    System.out.println("completion of the test!!!");
    }

Author: jony
Reprint policy: All articles in this blog are used except for special statements CC BY 4.0 reprint polocy. If reproduced, please indicate source jony !
 Previous
RS纠删算法原理 RS纠删算法原理
##RS纠删算法原理 A.1 纠删码是存储领域常用的数据冗余技术, 相比多副本复制而言, 纠删码能够以更小的数据冗余度获得更高数据可靠性。 Reed Solomon Coding是存储领域常用的一种纠删码,它的基本原理如下: 给定n个
2018-04-08
Next 
BP神经元网络算法 BP神经元网络算法
这是以前自己读研时的一个比较简单的项目,分享出来,希望能帮到一些对神经网络和模式识别感兴趣的人。#基于BP神经元网络算法的模式识别 BP神经元网络算法 神经网络是对人脑或自然神经网络的若干基本特性的抽象,是一种基于连接假说构造的智能仿生模型
2018-04-08
  TOC