找回密码
 FreeOZ用户注册
查看: 2713|回复: 0
打印 上一主题 下一主题

[论坛技术] FileHelper 一个极好的数据文本文件处理类库

[复制链接]
跳转到指定楼层
1#
发表于 7-7-2008 18:08:05 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
提示: 作者被禁止或删除, 无法发言

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有帐号?FreeOZ用户注册

x
这个我应该是看Scott的博客,看他介绍的经典小工具的时候看到的,感谢。
我经常接触到一些csv格式存储的数据文件,把这些文件导入数据库,或者把数据库的数据导出成为excel文件或者csv文件。
自己写功能解析自然好,但是需要处理的地方太多,如果是标准文件还好,但是如果文本文件里含有保留分隔符,或者数据格式有一些小错误,都需要自己处理。而且如果数据格式变化了,每次还要修改自己的代码。所以,我一直没写这个代码。
偷懒,一直用Excel的Text to Data 功能凑合,或者用SQL的导入导出功能,再就是用从网页上拷贝粘贴数据到excel,然后清除格式的方法。
这些方法其实都有弊端,典型的就是大量的手工才做,重复劳动,这些到还能忍受了,当涉及到数据库,用的最多的自然就是SQL自带的导入导出功能。这个功能大体上好用,可是如果文本文件里面有一点错误,他就罢工。这倒还可以忍受,后来我在64位机器上装了64位的SQL,这样微软居然不支持直接由Excel 导入,说64位版本不需要这个功能,我在网上看到了许多类似需求,微软都坚持说不提供这个64位的flat文件驱动!一等就是3年,SQL2005年发布,现在已经2008年了。可怕。
终于看到了这个阿根廷人编写的开源文本文件导入导出帮助类库!
本来以为还挺难使用,谁知,人家的帮助写得好,类库做的也好。我稍微调试了一下,就上手了!

最基本的用法可以看他主页的教程。
根据自己的文本文件格式,建立类库模板,定义好接受字段之类的。
增加引用类库文件到自己的项目。
一次性读取文本文件到内存。
最后是写入到其他的数据库或者转换格式保存。

我的问题是,我的文本文件比较大,大于50M,一次性读入的时候总是内存溢出,看了一下发现这个类库居然还提供了异步导入方式,就是读取一行,写一行!
略微看了一下,也好解决。

语法上,本类库兼容.net 1.0 和 .net 2.0,所以可以直接用.net 2.0的最新的语法写。写起来很方便!读取出来的数据可以直接赋给列表对象!
当然,类库本身也提供了对写入SQL,到处Excel的支持!由于作者的写入SQL的方式需要把SQL密码写道代码中,我就没有采用,而是自己用SQL数据连接写入SQL库的。
当然那个导出到EXcel的方式用起来还是很方便的。

总之这个工具最到的好处是,相当于你自己写了一个导入导出的功能,用法强大,容错性高,方便包含在自己的项目中,对文本进行自动化处理,完全省掉了自己编写功能的辛苦!强烈推荐!

The FileHelpers are a free and easy to use .NET library to import/export data from fixed length or delimited records in files, strings or streams.

The idea is pretty simple:

You can strong type your flat file (fixed or delimited) simply describing a class that maps to each record and later read/write your file as an strong typed .NET array

The Library also has support for import/export data from differents storages like Excel, Access, SqlServer, etc.

                               
登录/注册后可看大图


                               
登录/注册后可看大图


最新版下载地址(RC1的原因是因为作者最近在陪老婆生孩子,没时间发布最终版,恭喜!这个链接可能被国内拦住了,所以你可能需要代理访问下载!):
http://www.devoo.net/FileHelpers_2.2_RC1.rar

我把作者主页上的文件转到rapidshare上去,这个站点国内可以访问,需要的同学可以从rapidshare下载。
2.0编译版
http://rapidshare.com/files/1277 ... ocs_wizard.zip.html
2.0带源代码版
http://rapidshare.com/files/1277 ... _2003_2005.zip.html
2.2更新
http://rapidshare.com/files/1277 ... rs_2.2_RC1.rar.html

主页在这里,这个国内可以访问,有十分详细的帮助文档,一看就会,不要担心!!!
http://www.filehelpers.com/

下面是我做实验的代码,加了注释,你可以看一下,十分简单。
  1. 1using System;
  2. 2using System.Configuration;
  3. 3using System.Data.SqlClient;
  4. 4//在此处增加对这个类库的引用就可以了
  5. 5using FileHelpers;
  6. 6
  7. 7
  8. 8namespace FileHelpersSample
  9. 9{
  10. 10    public partial class _Default : System.Web.UI.Page
  11. 11    {
  12. 12        protected void Page_Load(object sender, EventArgs e)
  13. 13        {
  14. 14
  15. 15        }
  16. 16
  17. 17        protected void btImportFLFtoSQLbyLINQ_Click(object sender, EventArgs e)
  18. 18        {
  19. 19            
  20. 20            //清空所以已存在记录,
  21. 21            string SQLCommand = "TRUNCATE TABLE dbo.prm";
  22. 22            int sqlresult = RunSQLStatement(SQLCommand);
  23. 23            Response.Write(sqlresult);
  24. 24            Response.Write("<hr />");
  25. 25            
  26. 26            string strCSVFile = System.Web.HttpContext.Current.Server.MapPath("./") + "Data\\rrr.csv";
  27. 27            
  28. 28            //一次性读入整个文本文件
  29. 29            //FileHelperEngine<FLFRecordClass> engine = new FileHelperEngine<FLFRecordClass>();
  30. 30            //FLFRecordClass[] res = engine.ReadFile(strCSVFile);
  31. 31
  32. 32            //异步方式,一次读入一行,处理一行
  33. 33            FileHelperAsyncEngine<FLFRecordClass> engine = new FileHelperAsyncEngine<FLFRecordClass>();
  34. 34            engine.BeginReadFile(strCSVFile);
  35. 35
  36. 36            int i = 0;
  37. 37            while (engine.ReadNext() != null)
  38. 38            {
  39. 39                FLFRecordClass f = engine.LastRecord;
  40. 40
  41. 41                string Command;
  42. 42                #region
  43. 43                Command = "INSERT INTO dbo.prm VALUES(";
  44. 44                //用两个连着的单引号替换单引号,不然,这个SQL语句会报错
  45. 45                Command += "'" + f.Field1.Replace("'", "''") + "', ";
  46. 46                Command += "'" + f.Field2.Replace("'", "''") + "', ";
  47. 47                Command += "'" + f.Field3.Replace("'", "''") + "', ";
  48. 48                Command += "'" + f.Field4.Replace("'", "''") + "', ";
  49. 49                Command += "'" + f.Field5.Replace("'", "''") + "', ";
  50. 50                Command += "'" + f.Field6.Replace("'", "''") + "', ";
  51. 51                Command += "'" + f.Field7.Replace("'", "''") + "', ";
  52. 52                Command += "'" + f.Field8.Replace("'", "''") + "', ";
  53. 53                Command += "'" + f.Field9.Replace("'", "''") + "', ";
  54. 54                Command += "'" + f.Field10.Replace("'", "''") + "', ";
  55. 55               
  56. 56                //.Other fields
  57. 57
  58. 58                Command += "'" + f.Field111.Replace("'", "''") + "')";
  59. 59                #endregion
  60. 60
  61. 61                int j = RunSQLStatement(Command);
  62. 62                Response.Write(j);
  63. 63                Response.Write("
  64. ");
  65. 64                //if (i > 2) break;
  66. 65                i++;
  67. 66            }
  68. 67            engine.Close
  69.               Response.Write("<hr />");
  70. 68            Response.Write(i);
  71. 69
  72. 70
  73. 71        }
  74. 72
  75. 73
  76. 74        public static SqlConnection conn = new SqlConnection(ConfigurationManager.ConnectionStrings["FLFConnectionString"].ConnectionString);
  77. 75        
  78. 76        //自定义函数,用于实现对SQL数据库的更新操作
  79. 77        public int RunSQLStatement(string Command)
  80. 78        {
  81. 79            SqlCommand DataCommand = new SqlCommand(Command, conn);
  82. 80            DataCommand.Connection.Open();
  83. 81            int i = DataCommand.ExecuteNonQuery();
  84. 82            DataCommand.Connection.Close();
  85. 83            return i;
  86. 84        }
  87. 85
  88. 86    }
  89. 87}
复制代码
读取文本文件时,需要实现定义一个类,这个类的语法也十分简单,而且作者还提供了一个帮助向导,帮助你自动生成这个类文件(真是体贴周到!)
我这里为了偷懒,读入的时候就都都成了字符型,而且也没加什么处理,其实这个类库还只是纠错,按格式读取,读取的时候转换格式等功能!你自己慢慢看,需要的时候再用。我是一次性转到SQL临时表里,自己用程序再处理的,当然你可以用作者提供的类库在读入的时候一次性处理,究竟哪种方式好,我还没研究,感觉自己的方式比较省事(你说的?愿意听你的看法。)
  1. 1using System;
  2. 2using FileHelpers;
  3. 3
  4. 4namespace FileHelpersSample
  5. 5{
  6. 6
  7. 7    [IgnoreFirst(1)]
  8. 8    [IgnoreEmptyLines()]
  9. 9    [DelimitedRecord(",")]
  10. 10    public sealed class FLFRecordClass
  11. 11    {
  12. 12
  13. 13        [FieldQuoted('"', QuoteMode.OptionalForRead, MultilineMode.AllowForRead)]
  14. 14        public String Field1;
  15. 15
  16. 16        [FieldQuoted('"', QuoteMode.OptionalForRead, MultilineMode.AllowForRead)]
  17. 17        public String Field2;
  18. 18
  19. 19        [FieldQuoted('"', QuoteMode.OptionalForRead, MultilineMode.AllowForRead)]
  20. 20        public String Field3;
  21. 21
  22. 22        [FieldQuoted('"', QuoteMode.OptionalForRead, MultilineMode.AllowForRead)]
  23. 23        public String Field4;
  24. 24
  25. 25        [FieldQuoted('"', QuoteMode.OptionalForRead, MultilineMode.AllowForRead)]
  26. 26        public String Field5;
  27. 27
  28. 28        [FieldQuoted('"', QuoteMode.OptionalForRead, MultilineMode.AllowForRead)]
  29. 29        public String Field6;
  30. 30
  31. 31        [FieldQuoted('"', QuoteMode.OptionalForRead, MultilineMode.AllowForRead)]
  32. 32        public String Field7;
  33. 33
  34. 34        [FieldQuoted('"', QuoteMode.OptionalForRead, MultilineMode.AllowForRead)]
  35. 35        public String Field8;
  36. 36
  37. 37        [FieldQuoted('"', QuoteMode.OptionalForRead, MultilineMode.AllowForRead)]
  38. 38        public String Field9;
  39. 39
  40. 40        [FieldQuoted('"', QuoteMode.OptionalForRead, MultilineMode.AllowForRead)]
  41. 41        public String Field10;
  42. 42
  43. 43        //.
  44. 44  
  45. 45        [FieldQuoted('"', QuoteMode.OptionalForRead, MultilineMode.AllowForRead)]
  46. 46        public String Field111;
  47. 47
  48. 48    }
  49. 49
  50. 50
  51. 51}
  52. 52
复制代码

[ 本帖最后由 xblues 于 7-7-2008 16:05 编辑 ]
回复  

使用道具 举报

您需要登录后才可以回帖 登录 | FreeOZ用户注册

本版积分规则

小黑屋|手机版|Archiver|FreeOZ论坛

GMT+11, 17-11-2024 08:32 , Processed in 0.029059 second(s), 17 queries , Gzip On, Redis On.

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表