Amazon 解決下載文件亂碼
大家在做多個站點的時候,可能會遇到下載下來的報告文件出現亂碼。
法國站點和意大利站點均會出現這樣的情況,那怎么解決呢?
這是由于編碼的問題而導致,在我們讀取數據插入到本地數據庫的時候,不妨先將格式轉成對應國家能正確識別的格式。
在文檔中也有看到。

還要一個問題需要說明,由于操作系統設置默認語言的原因,在小國家站點,我們下載下來的報告可能會出現亂碼的情況。這種情況很正常,在調用接口的時候,也沒有辦法去解決直接下載就出現正常編碼。
現在的方法是將下載下來的亂碼文件,通過流操作,重新編碼,根據上圖對應的編碼來設置編碼。
文章來自[https://www.cnblogs.com/yangda/p/3963220.html](https://www.cnblogs.com/yangda/p/3963220.html)
以下已驗證可行
```
# 檢測編碼,未檢測到用市場指定的編碼轉utf8;檢測出來,用檢測的編碼轉utf8;如果是utf8,則不作處理
// $encode = mb_detect_encoding($result, array("UTF-8",'iso-8859-1',"Shift_JIS","cp1252",'UTF-16'));
$encode = mb_detect_encoding($result);
if($encode == false){
$marketplaceId = $this->config['Marketplace_Id'];
if(in_array($marketplaceId, $this->market_EU) || in_array($marketplaceId, $this->market_US)){
$result = mb_convert_encoding($result, "UTF-8", ["iso-8859-1", "cp1252"]);
}else if(in_array($marketplaceId, $this->market_JP)){
$result = mb_convert_encoding($result, 'UTF-8', ["Shift_JIS"]);
}else if(in_array($marketplaceId, $this->market_CN)){
$result = mb_convert_encoding($result, 'UTF-8', ["UTF-8", "UTF-16"]);
}else{
$result = mb_convert_encoding($result, "UTF-8", ["cp1252"]);
}
}else if($encode != 'UTF-8'){
$result = mb_convert_encoding($result, "UTF-8", $encode);
}
private $market_US = [
'ATVPDKIKX0DER',
'A1AM78C64UM0Y8',
'A2EUQ1WTGCTBG2',
'A21TJRUUN4KGV',
'A2Q3Y263D00KWC',
'A39IBJ37TRP1C6',
];
private $market_EU = [
'A1PA6795UKMFR9',
'A1RKKUPIHCS9HS',
'A13V1IB3VIYZZH',
];
private $market_JP = [
'A1VC38T7YXB528'
];
private $market_CN = [
'AAHKV2X7AFYLW'
];
```
```
<?php
namespace App\Service\Amazon;
class MarketplaceId {
# North America region
const BR = 'A2Q3Y263D00KWC'; # 巴西
const CA = 'A2EUQ1WTGCTBG2'; # 加拿大
const MX = 'A1AM78C64UM0Y8'; # 墨西哥
const US = 'ATVPDKIKX0DER'; # 美國
# Europe region
const AE = 'A2VIGQ35RCS4UG'; # 阿聯酋
const DE = 'A1PA6795UKMFR9'; # 德國
const EG = 'ARBP9OOSHTCHU'; # 埃及
const ES = 'A1RKKUPIHCS9HS'; # 西班牙
const FR = 'A13V1IB3VIYZZH'; # 法國
const GB = 'A1F83G8C2ARO7P'; # 英國
const IN = 'A21TJRUUN4KGV'; # 印度
const IT = 'APJ6JRA9NG5V4'; # 意大利
const SA = 'A17E79C6D8DWNP'; # 沙特阿拉伯
const TR = 'A33AVAJ2PDY3EV'; # 土耳其
# Far East region
const SG = 'A19VAU5U5O7RUS'; # 新加坡
const AU = 'A39IBJ37TRP1C6'; # 澳大利亞
const JP = 'A1VC38T7YXB528'; # 日本
const CN = 'AAHKV2X7AFYLW'; # 中國
}
```
后續更新:
實際上出現了檢測出編碼為ISO-8859-1,最后轉碼還是亂碼。該$result寫入xls文件,雙擊打開日文顯示正常。
后面發現,我改變該檢測字符編碼函數的第三個參數,結果卻各不相同:
`$encode = mb_detect_encoding($result, array("UTF-8",'iso-8859-1',"Shift_JIS","cp1252",'UTF-16')); `
`$encode = mb_detect_encoding($result, array("UTF-8",'Shift_JIS',"iso-8859-1","cp1252",'UTF-16')); `
`$encode = mb_detect_encoding($result); `
同一個字符串三個返回結果都不一樣。分別為:
ISO-8859-1
SJIS
false
這個檢測編碼的函數可能存在問題,需要后續深入研究。
但是,第二和第三的結果分別會構成
`$result = mb_convert_encoding($result, 'UTF-8', 'SJIS');`
和
`$result = mb_convert_encoding($result, 'UTF-8', 'Shift_JIS');`
邏輯。
都會正常轉換成日文。
我的猜想是:
mb_convert_encoding并不是一個嚴格函數,在第三個參數【待檢測的字符編碼列表】給出的情況下,他會按順序檢測字符特性的符合度,達不到,按給出列表的順序逐個匹配,達到一定符合度就直接返回匹配的編碼,后續不再檢測。
所以,在一個字符串的字符特性與多個編碼的匹配度滿足符合度的情況下,誰排在前面就return誰。所以出現了第一和第二的不同編碼返回。
所以我這里建議是,如果已知目標字符串是哪國編碼,指定轉換即可,或者在mb_detect_encoding的檢測列表將該國編碼或者可能性按大小依次排列
對于你這個問題,既然已知日文,直接`mb_convert_encoding($result, 'UTF-8', 'Shift_JIS');`試試。
- 常見功能
- 第三方授權登錄
- 郵件發送
- 簡易聊天室
- 獲取各國匯率
- PHP獲取服務器硬件指標
- 數據上報之
- web開發
- 開發規范
- 前端
- 踩坑
- 將footer固定在底部
- bootstrap
- Metronic
- 用到的jquery插件
- bootstrap-hover-dropdown
- jquery.slimscroll
- jquery.blockui
- bootstrap-switch
- js.cookie
- moment
- bootstrap-daterangepicker
- morris
- raphael
- jquery.waypoints
- jquery.counterup
- select2
- 取值和設置默認值
- vue
- axios
- 瀏覽器
- 谷歌瀏覽器
- 谷歌插件
- layui
- layui-表格
- layui-表單
- layui-彈窗
- layui-分頁
- 后端
- 操作系統
- linux
- 用戶管理
- 文件管理
- 目錄管理
- 壓縮和解壓縮
- 進程查看
- 端口查看
- 開機自啟動服務
- 定時任務
- shell腳本
- 殺掉運行超過指定時長指定服務的進程
- 獲取服務器使用狀態
- bash-shell連接socket
- 自定義快捷命令
- centos-踩坑
- 防火墻
- 軟件
- yum
- vim
- screen
- window
- 語言
- PHP
- 配置優化
- 框架
- thinkphp5.1+
- think命令行
- laravel6.+
- 維護模式
- 根據環境讀取不同配置
- laravel6.+采坑
- laravel坑位
- 數據庫事務
- 任務調度
- 文件權限問題
- 增強框架
- larvel:elastic-search
- 圖形驗證碼
- laravel獲取ip
- 函數
- strtotime
- 正則匹配
- 類
- 接口類與抽象類
- 類相關的關鍵字 - abstract
- 類相關的關鍵字 - interface
- PHP有關類的調用方式"->"與"::"的區別
- 擴展
- 問題歸納
- json_encode和json_decode
- 字符串的運算
- curl
- 優化php效率
- 數組相加合并與array_merge
- 時區轉換
- 不常用特性
- php反射
- 包管理器-composer
- GuzzleHttp
- Python
- Go
- 數據庫
- Redis
- 安裝
- 本地化-數據備份
- php-redis操作
- Mysql
- mysql-命令集合
- 設置終端可訪問
- 數據庫設計
- 用戶基礎信息表
- 踩坑集合
- mysql-2002
- mysql-2054
- 優化策略
- mysql-密碼驗證插件
- 一些牛逼的sql查詢
- topN
- 無限級分類
- Memcache
- MongoDb
- 安裝mongo-server
- 安裝php-mongodb擴展
- 在laravel中使用mongoDB
- 客戶端軟件
- Hbase
- Elasticsearch
- elastic-search
- restfulApi操作es
- web服務器
- 1.nginx
- 配置語法規則
- 配置詳解
- rewrite規則
- request_filename
- 2.apache
- 功能設計
- 加密解密
- Base64
- 對亞馬遜SKU加密
- 兼職項目中的加解密
- 騰訊外包時的加密
- 接口設計
- 接口限流設計
- 分庫分表
- 遍歷展示文件目錄結構
- 時區換算
- 文件切割
- 解析xml字符串
- 項目
- 博客后臺管理
- 亞馬遜廣告API
- 官方指引文檔
- 開發人員中心
- 應用商店
- 第三方庫
- 申請API郵件記錄
- 亞馬遜MWS
- 付款報告
- 亂碼
- 亞馬遜管理庫存報告
- 報告
- 商品
- 入庫
- 履行
- 出庫
- 財務
- 訂單
- 異步任務處理
- 集群如何同步代碼
- 基本開發流程
- 文檔管理
- showdoc
- 運行環境
- 開發環境
- vagrant
- windows上配置安裝
- vagrant安裝插件緩慢
- 更換ssh默認端口映射
- 設置x-shell密碼登錄
- 使用市場的box-homestead
- homestead-7: Box 'lc/homestead'
- 常見問題
- 虛擬環境reboot
- 突然無法使用
- phpStudy
- wamp
- 壓測性能
- VPN
- vultr
- 凌空圖床
- 寶塔
- 自動化部署
- 版本管理軟件鉤子
- 線上環境-LNMP
- centos7
- nginx
- mysql
- mysql開機自啟
- mysql-更換默認端口
- datetime字段類型默認值
- php
- php擴展安裝
- redis
- swoole
- gd
- BCMath
- igbinary
- zstd
- 包管理器:composer
- 優化性能
- nodejs
- 更新gcc版本
- 版本控制
- git
- 常用命令
- gitlab
- 版本管理規范
- 使用阿里云創建遠程倉庫
- git自動化部署
- svn
- 忽略指定文件
- 拉取代碼
- 自動化運維
- jekins
- 容器
- 集群
- 架構設計
- 設計原則
- 閱讀參考
- 代碼規劃
- 架構實戰
- 服務治理
- 權限控制設計
- 具體設計
- 計劃
- 疑問知識點
- 讀書筆記
- 高性能Mysql
- TCP-IP詳解-卷一:協議
- 思考
- php如何實現并發執行
- 對接調用設計
- 如何在瀏覽器上實現插件
- 如何設計一個app結合業務告警
- mysql的where查詢沒有用到索引
- 為啥in查詢比循環嵌套sql的查詢還要慢
- 使用git來創建屬于自己的composer包
- 翻頁獲取數據的時候又新增了數據
- 安全思路
- 月報
- PHP ?? 和 ?: 的區別
- PHP異步執行
- redis集群的目標是什么
- 大文件數據處理
- 性能瓶頸分析
- 命令行里輸出帶顏色的字體
- 面試問題合集
- 基礎
- 安全
- 算法
- 冒泡排序
- 快速排序
- 二分法查詢數組指定成員
- 字符查找匹配
- 令牌桶
- 漏桶
- 計數器
- 代理
- 協議
- http
- 狀態碼
- tcp
- udp
- Oauth2.0
- 設計模式
- 單例模式
- 適配器模式
- 工廠模式
- 觀察者模式
- 流程化
- 地址欄輸入網址到返回網頁的流程
- 題目收集
- 工具
- rabbitMq
- rabbitMQ用戶管理
- 生產者
- 消費者
- 支持TP5.*的think-queue
- 消息丟失
- 消費者報錯
- rabbitMQ配置優化
- 磁盤滿載導致服務掛掉
- PHP類庫
- rabbitMQ踩坑
- navicat
- vscode
- phpstorm
- 激活碼
- markdown
- PHP自定義類庫
- 工具類
- 領導力
- 任務分配
- 代碼組織
- 不要重復
- 避免污染
- 接口定義規范
- 小業務需求
- 獲取充值面額組成
- 監控服務器CPU和內存
- shell腳本版本