当前位置: 首页 > 期刊 > 《中国中药杂志》 > 2014年第12期
编号:13126008
中国动物药材DNA条形码数据库(1)
http://www.100md.com 2014年6月15日 《中国中药杂志》 2014年第12期
     [摘要]课题组联合相关研究者开展动物药材DNA条形码分子鉴定研究,并结合分析GenBank序列,采用BLAST分析防错、系统树分析防错和Barcoding Gap检验防错等方法核验序列的可靠性,构建了中国动物药材DNA条形码数据库。该库由样品数据库、序列数据库和文献数据库组成,包含800余种动物药材和大量动物药材混伪品及密切相关物种。中国动物药材DNA条形码数据库可以通过中药材DNA条形码鉴定系统(www.tcmbarcode.cn)进行网络访问并实现未知动物样本的DNA条形码鉴定。该研究首次构建统一的中国动物药材DNA条形码数据库,对动物药材鉴定、资源可持续利用和濒危物种保护均有重要意义。

    [关键词]动物药材;数据库;COI;鉴定

    DNA条形码技术是动物药材鉴定的新工具[1],国家药典委员会已讨论通过在《中国药典》增补本中列入中药材DNA条形码分子鉴定指导原则[2]。本课题组联合相关研究者开展了大量的动物药材DNA条形码分子鉴定研究工作。鄢丹等对包含羚羊角、鹿角的传统角类药材进行DNA条形码研究[3],并以此为基础提出了濒危动物药材的贸易监控和替代品寻找策略[4]。张辉等对《中国药典》45种动物药材及其混伪品进行DNA条形码研究,结果表明45种动物药材的正品来源与其混伪品均可相互区分[5]。崔丽娜等利用COI序列对金钱白花蛇及其常见混伪品进行DNA条形码鉴别研究,结果表明,金钱白花蛇COI序列可以明确地与混伪品区分开[6]。胡嵘等对海马、海龙及其混伪品共14个种20份样品的COI条形码序列进行研究,结果表明运用COI序列能够准确鉴定海马、海龙的基原动物及其混伪品[7]。此外,还开展了龟甲、鳖甲、鹿茸以及蛤壳等的DNA条形码研究工作[8-11]。动物DNA条形码分子鉴定研究工作的大量开展,为构建中国动物药材DNA条形码数据库奠定了基础。
, http://www.100md.com
    DNA条形码数据库不仅是存储样品信息和DNA条形码序列的工具,而且是DNA条形码研究和物种鉴定分析的生物信息学平台,对推动DNA条形码研究发展具有重要意义[12]。第一个国际DNA条形码数据系统(BOLD)由国际生命条形码联盟(CBOL)于2007年建立[13]。此外,国际上还有多个针对特定动物类群的条形码数据库,如:Fish Barcode of Life Campaign (FISH-BOL,http://www.fishbol.org/),Lepidoptera Barcode of Life(http://lepbarcoding.org/),Mammalia Barcode of Life Campaign(http://www.mammaliabol.org/)。此外,邵鹏柱等初步构建了传统药物DNA条形码数据库(http://137.189.42.34/mherbsdb/),包含1 661个物种,36 679条序列[14]。当前,我国尚未构建统一的动物药材DNA条形码数据库,制约了DNA条形码技术在动物药材鉴定、资源可持续利用和濒危物种保护中的进一步应用。
, 百拇医药
    1 材料

    中国动物药材DNA条形码数据库中的序列来自于课题组联合相关研究者所开展的动物药材DNA条形码分子鉴定研究及GenBank,包含800余种动物药材和大量动物药材混伪品及密切相关物种(表1)。

    2 方法

    对包含测序峰图的样品,根据Q值进行单碱基和序列质量检测。对不包含测序峰图的样品,使用EMBOSS Transeq将核酸序列翻译为蛋白序列,利用隐马尔可夫模型(hidden Markov model,HMM)进行COI条形码区域核验[13]。采用BLAST分析防错、系统树分析防错和Barcoding Gap检验防错等核验COI序列的可靠性[2],使用Muscle 3.8 进行多序列比对[15],使用Paup 4.0进行遗传距离计算[16],使用MEGA 6.0构建NJ(邻接法)系统聚类树[17]。使用BLAST方法进行物种鉴定分析,使用MySQL进行数据库管理,通过MySQLdb连接MySQL数据库。
, 百拇医药
    3 结果与讨论

    3.1 数据库构成 中国动物药材DNA条形码数据库由样品数据库、序列数据库和文献数据库构成。样品数据库包含完整的样品采集和鉴定信息,即:样品编号、分类信息、凭证信息、采集者、采集地、鉴定者、1张到数张样品及生境照片等。从GenBank中下载GB格式文件,利用BioPython进行解析。仅保留物种分类地位清晰,拉丁名不包含“sp.”,“spp.”等字符的Record。提取Record注释中基因名称为“COI”或“CO1”区域的序列,如Record来自于已发表的文献,收集该文献的PubMed ID、题目、作者、期刊、摘要等信息构成文献数据库。此外,文献数据库还包含本课题组联合相关研究者所开展的动物药材DNA条形码分子鉴定研究文献。中国动物药材DNA条形码数据库包含2010年版《中国药典》[18]和《中国药用动物志》(第2版)[19]所载800余种动物药材和大量动物药材的混伪品和密切相关物种的COI序列。此外,中国动物药材DNA条形码数据库还包含样品采集、样品处理、DNA提取、PCR 扩增、测序、序列拼接及结果判定等的标准操作方法和技术流程(图1)。
, 百拇医药
    3.2 数据库动态管理 中国动物药材DNA条形码数据库每6个月更新1次。新增加样品如包含测序峰图,则依照中药材DNA条形码分子鉴定指导原则去除测序峰图两端的低质量区域[2],即:以20 bp的窗口分别从序列5′端和3′端进行滑动,如果窗口内有多于2个碱基的Q值<20,则删除1个碱基,窗口继续滑动1个碱基;如果窗口内碱基Q值小于20的数目≤2,窗口停止滑动。测序峰图的剩余部分须≥300 bp,平均Q值≥30。拼接结果长度须大于500 bp,Q值小于20的碱基数须≤1%,平均Q值须≥40。新增加样品如不包含测序峰图,使用EMBOSS Transeq将新增加COI序列翻译为蛋白序列,使用隐马尔可夫模型进行COI条形码区域核验,序列中COI条形码区域的长度须≥500 bp,且Ns≤1%。最后将序列与已有参考数据库进行比对,去除可能的外源污染,例如螨虫、人等的COI序列。, http://www.100md.com(石林春 姚辉 谢丽芳 朱英杰 宋经元 张辉 陈士林)
1 2 3下一页