今天在日常維護一個網站時,發(fā)現該網站的留言程序沒有經過嚴格的驗證過濾,導致了將近十萬條垃圾數據。而其中又不乏重要信息,需要清理數據,以及增加更為嚴格的驗證措施。
而通過在數據庫中直接刪除又不太科學,會誤刪很多重要信息。
通過 模糊查詢語句:
結果:“內存溢出”
經過不斷的搜索,找出了問題的主要原因:
asp 中用 LIKE 關鍵字查詢日文符號就會出錯,比如說Chr(-23075),提示內存溢出。
如果數據表中的數據包含日文或者一些特殊非簡體漢字符號,也會出現內存溢出的錯誤。
而網上說,上述問題已經得到微軟動力營的微軟工程師確認,為產品的 BUG,無法解決。唯一的辦法就是將整個數據庫中的數據編碼為ANSI 文本格式,然后保存。顯示的時候再DECODE。
無解,只有按上面所說,進行字段轉換保存到另外一個新字段中,然后再進行清理操作。面對這個超標數據真是困難。
EncodeString 函數進行字符轉義
這樣經過轉義后,在模糊搜索時,將關鍵字進行轉義一下