HAProxy配置文件详解及常用案例

一、完整haproxy文件例子
global
    log        127.0.0.1 local2
    chroot     /var/lib/haproxy
    pidfile    /var/run/haproxy.pid
    maxconn    4000
    user       haproxy
    group      haproxy
    daemon
    # turn on stats unix socket
    stats socket /var/lib/haproxy/stats
defaults
    mode                    http
    log                     global
    option                  httplog
    option                  dontlognull
    option http-server-close
    option forwardfor       except 127.0.0.0/8
    option                  redispatch
    retries                 3
    timeout http-request    10s
    timeout queue           1m
    timeout connect         10s
    timeout client          1m
    timeout server          1m
    timeout http-keep-alive 10s
    timeout check           10s
    maxconn                 3000
frontend  main *:5000
    acl url_static       path_beg       -i /static /images /javascript/stylesheets
    acl url_static       path_end       -i .jpg .gif .png .css .js 
    use_backend static          if url_static
    default_backend             app
backend static
    balance    roundrobin
    server     static 127.0.0.1:4331 check
backend app
    balance    roundrobin
    server app1 127.0.0.1:5001 check
    server app2 127.0.0.1:5002 check
    server app3 127.0.0.1:5003 check
    server app4 127.0.0.1:5004 check
 
二、配置文件构成
haproxy的配置文件由两部分组成：全局设定和对代理的设定，共分为五段：global，defaults，frontend，backend，listen。
 •global：参数是进程级的，通常和操作系统（OS）相关。这些参数一般只设置一次，如果配置无误，就不需要再次配置进行修改
 •defaults：配置默认参数的，这些参数可以被利用配置到frontend，backend，listen组件
 •frontend：接收请求的前端虚拟节点，Frontend可以根据规则直接指定具体使用后端的     backend(可动态选择)。
 •backend：后端服务集群的配置，是真实的服务器，一个Backend对应一个或者多个实体服务器。
 • listen：Frontend和Backend的组合体。
 
三、时间格式
一些包含了值的参数表示时间，如超时时长。这些值一般以毫秒为单位，但也可以使用其它的时间单位后缀。
us:微秒(microseconds)，即1/1000000秒； ms: 毫秒(milliseconds)，即1/1000秒； s: 秒(seconds)； m:分钟(minutes)； h：小时(hours)； d: 天(days)；
 
四、全局配置
1、进程管理及安全相关的参数
– chroot <jaildir>：修改haproxy的工作目录至指定的目录并在放弃权限之前执行chroot()操作，可以提升haproxy的安全级别，不过需要注意的是要确保指定的目录为空目录且任何用户均不能有写权限；
–daemon：让haproxy以守护进程的方式工作于后台，其等同于“-D”选项的功能，当然，也可以在命令行中以“-db”选项将其禁用；
– gid<number>：以指定的GID运行haproxy，建议使用专用于运行haproxy的GID，以免因权限问题带来风险；
– group <groupname>：同gid，不过指定的组名；
– log <address><facility> [max level [min level]]：定义全局的syslog服务器，最多可以定义两个；
– log-send-hostname[<string>]：在syslog信息的首部添加当前主机名，可以为“string”指定的名称，也可以缺省使用当前主机名；
– nbproc<number>：指定启动的haproxy进程的个数，只能用于守护进程模式的haproxy；默认只启动一个进程，鉴于调试困难等多方面的原因，一般只在单进程仅能打开少数文件描述符的场景中才使用多进程模式；
– pidfile：
–uid：以指定的UID身份运行haproxy进程；
–ulimit-n：设定每进程所能够打开的最大文件描述符数目，默认情况下其会自动进行计算，因此不推荐修改此选项；Linux默认单进程打开文件数为1024个
– user：同uid，但使用的是用户名；
– stats：用户访问统计数据的接口
–node：定义当前节点的名称，用于HA场景中多haproxy进程共享同一个IP地址时；
–description：当前实例的描述信息；
2、性能调整相关的参数
– maxconn<number>：设定每个haproxy进程所接受的最大并发连接数，其等同于命令行选项“-n”；“ulimit-n”自动计算的结果正是参照此参数设定的；
– maxpipes<number>：haproxy使用pipe完成基于内核的tcp报文重组，此选项则用于设定每进程所允许使用的最大pipe个数；每个pipe会打开两个文件描述符，因此，“ulimit-n”自动计算时会根据需要调大此值；默认为maxconn/4，其通常会显得过大；
–noepoll：在Linux系统上禁用epoll机制；
–nokqueue：在BSE系统上禁用kqueue机制；
– nopoll：禁用poll机制；
–nosepoll：在Linux禁用启发式epoll机制；
–nosplice：禁止在Linux套接字上使用内核tcp重组，这会导致更多的recv/send系统调用；不过，在Linux2.6.25-28系列的内核上，tcp重组功能有bug存在；
– spread-checks<0..50, inpercent>：在haproxy后端有着众多服务器的场景中，在精确的时间间隔后统一对众服务器进行健康状况检查可能会带来意外问题；此选项用于将其检查的时间间隔长度上增加或减小一定的随机时长；
– tune.bufsize<number>：设定buffer的大小，同样的内存条件小，较小的值可以让haproxy有能力接受更多的并发连接，较大的值可以让某些应用程序使用较大的cookie信息；默认为16384，其可以在编译时修改，不过强烈建议使用默认值；
– tune.chksize<number>：设定检查缓冲区的大小，单位为字节；更大的值有助于在较大的页面中完成基于字符串或模式的文本查找，但也会占用更多的系统资源；不建议修改；
– tune.maxaccept<number>：设定haproxy进程内核调度运行时一次性可以接受的连接的个数，较大的值可以带来较大的吞吐率，默认在单进程模式下为100，多进程模式下为8，设定为-1可以禁止此限制；一般不建议修改；
– tune.maxpollevents<number>：设定一次系统调用可以处理的事件最大数，默认值取决于OS；其值小于200时可节约带宽，但会略微增大网络延迟，而大于200时会降低延迟，但会稍稍增加网络带宽的占用量；
– tune.maxrewrite<number>：设定为首部重写或追加而预留的缓冲空间，建议使用1024左右的大小；在需要使用更大的空间时，haproxy会自动增加其值；
– tune.rcvbuf.client<number>：
– tune.rcvbuf.server<number>：设定内核套接字中服务端或客户端接收缓冲的大小，单位为字节；强烈推荐使用默认值；
– tune.sndbuf.client：
– tune.sndbuf.server：
3、Debug相关的参数
- debug - quiet
4、超时时长
timeout http-request：在客户端建立连接但不请求数据时，关闭客户端连接
timeout queue：等待最大时长
timeout connect：定义haproxy将客户端请求转发至后端服务器所等待的超时时长
timeoutclient：客户端非活动状态的超时时长
timeout server：客户端与服务器端建立连接后，等待服务器端的超时时长，
timeouthttp-keep-alive：定义保持连接的超时时长
timeout check：健康状态监测时的超时时间，过短会误判，过长资源消耗
maxconn :每个server最大的连接数
http-server-close:在使用长连接时，为了避免客户端超时没有关闭长连接，此功能可以使服务器端关闭长连接
redispatch：在使用基于cookie定向时，一旦后端某一server宕机时，会将会话重新定向至某一上游服务器，必须使用的选项
5、实现访问控制
http-request: 7层过滤
tcp-request content:tcp层过滤，四层过滤
 代理
代理相关的配置可以如下配置段中。
– defaults <name>
– frontend <name>
– backend <name>
– listen <name>
“defaults”段用于为所有其它配置段提供默认参数，这配置默认配置参数可由下一个“defaults”所重新设定。
“frontend”段用于定义一系列监听的套接字，这些套接字可接受客户端请求并与之建立连接。
“backend”段用于定义一系列“后端”服务器，代理将会将对应客户端的请求转发至这些服务器。
“listen”段通过关联“frontend”和“backend”定义了一个完整的代理，通常只对TCP流量有用。
所有代理的名称只能使用大写字母、小写字母、数字、-(中线)、_(下划线)、.(点号)和:(冒号)。此外，ACL名称会区分字母大小写。
 
五、配置文件中的关键字参考
1、balance：
balance [ ]
balance url_param[check_post []]
定义负载均衡算法，可用于“defaults”、“listen”和“backend”。用于在负载均衡场景中挑选一个server，其仅应用于持久信息不可用的条件下或需要将一个连接重新派发至另一个服务器时。支持的算法有：
 • Round-Robin（roundrobin）：
与Keeplived的Round-Robin类似，使用这种算法服务请求会被轮询转发到服务器池中的每一个服务器上，而不去评估服务器的‰负载和处理能力，服务器池中的每个节点都被轮询转发请求。
  • Static Round-Robin（static-rr）：
与Round-Robin一样轮询转发请求到每一个后端服务器，但是不允许对后端服务器进行动态加权设置，即服务器的权重是静态固定的，而由于权重静态固定，后端服务器池中的节点数目不受限。
  • Least-connection（leastconn）：
即最少连接数算法，与Keepalived的最少连接数算法类似，后端服务器活动连接数越多，则接收到的服务请求就越少，反之，则接收到的服务请求越多。
  • Source（source）：
该算法将请求中的源IP地址进行HASH后除以全部正常运行的后端服务器权重来决定接收服务请求的服务器，在这种算法中，同一个客户端（相同的源IP地址）发出的请求会被固定转发给某一个固定的后端服务器。
但是，如果服务器权重大小发生改变或者服务器数目出现变动，则响应该客户端请求的后端服务器会改变，因为这时的HASH/Wight值已经改变。
 •URL（url）：该算法将请求URL字符串进行HASH并除以全部正常运行的后端服务器权重来决定接收服务请求的服务器，在这种算法中，指向同一目标站点的服务请求会被固定转发到相同的后端服务器上。URL也称为基于目标地址的HASH负载均衡算法，主要用于WebCache集群中，通过URL负载均衡算法，可以避免请求因为指向不同的cache服务器而导致缺页，而缺页会导致刷新 cache最终降低系统响应速率。
 • URL Parameter（uri_param）：该算法通过查询源HTTP请求报文中的某一字符串参数并将其进行HASH后除以全部服务器权重来决定接收服务请求的服务器。如果HTTP报文中没有需要的参数，则默认使用Round_Robin算法。
 • HeaderName（hdr）：该算法通过查询HTTP请求报文中的HEAD字段并将HASH后除以全部服务器权重来决定接收服务请求的服务器。如果报文中没有HEAD参数，则默认使用Round_Robin算法。
 • rdp-cookie(name)
表示根据据cookie(name)来锁定并哈希每一次TCP请求。
2、bind：
bind[<address>]:<port_range> [, …]
bind[<address>]:<port_range> [, …] interface <interface>
此指令仅能用于frontend和listen区段，用于定义一个或几个监听的套接字。
 •<address>：可选选项，其可以为主机名、IPv4地址、IPv6地址或*；省略此选项、将其指定为*或0.0.0.0时，将监听当前系统的所有IPv4地址；<port_range>：可以是一个特定的TCP端口，也可是一个端口范围(如5005-5010)，代理服务器将通过指定的端口来接收客户端请求；需要注意的是，每组监听的套接字<address:port>在同一个实例上只能使用一次，而且小于1024的端口需要有特定权限的用户才能使用，这可能需要通过uid参数来定义；<interface>：指定物理接口的名称，仅能在Linux系统上使用；其不能使用接口别名，而仅能使用物理接口名称，而且只有管理有权限指定绑定的物理接口；
3、mode：
mode { tcp|http|health}
设定实例的运行模式或协议。当实现内容交换时，前端和后端必须工作于同一种模式(一般说来都是HTTP模式)，否则将无法启动实例。
 •tcp：实例运行于纯TCP模式，在客户端和服务器端之间将建立一个全双工的连接，且不会对7层报文做任何类型的检查；通常用于SSL、SSH、SMTP等应用；
 •http：实例运行于HTTP模式，客户端请求在转发至后端服务器之前将被深度分析，所有不与RFC格式兼容的请求都会被拒绝；此为默认模式；
 •health：实例工作于health模式，其对入站请求仅响应“OK”信息并关闭连接，且不会记录任何日志信息；此模式将用于响应外部组件的健康状态检查请求；目前来讲，此模式已经废弃，因为tcp或http模式中的monitor关键字可完成类似功能；
4、hash-type
hash-type<method>
定义用于将hash码映射至后端服务器的方法；其不能用于frontend区段；可用方法有map-based和consistent，在大多数场景下推荐使用默认的map-based方法。
 •map-based：hash表是一个包含了所有在线服务器的静态数组。其hash值将会非常平滑，会将权重考虑在列，但其为静态方法，对在线服务器的权重进行调整将不会生效，这意味着其不支持慢速启动。此外，挑选服务器是根据其在数组中的位置进行的，因此，当一台服务器宕机或添加了一台新的服务器时，大多数连接将会被重新派发至一个与此前不同的服务器上，对于缓存服务器的工作场景来说，此方法不甚适用。
 •consistent：“一致性哈希算法”，hash表是一个由各服务器填充而成的树状结构，将服务器散列在hash环上；基于hash键在hash树中查找相应的服务器时，最近的服务器将被选中。此方法是动态的，支持在运行时修改服务器权重，因此兼容慢速启动的特性。添加一个新的服务器时，仅会对一小部分请求产生影响，因此，尤其适用于后端服务器为cache的场景。不过，此算法不甚平滑，派发至各服务器的请求未必能达到理想的均衡效果，因此，可能需要不时的调整服务器的权重以获得更好的均衡性。
5、log
log global
log <address><facility> [<level> [<minlevel>]]
为每个实例启用事件和流量日志，因此可用于所有区段。每个实例最多可以指定两个log参数，不过，如果使用了“logglobal”且”global”段已经定了两个log参数时，多余了log参数将被忽略。
 •global：当前实例的日志系统参数同”global”段中的定义时，将使用此格式；每个实例仅能定义一次“log global”语句，且其没有任何额外参数；
 •<address>：定义日志发往的位置，其格式之一可以为<IPv4_address:PORT>，其中的port为UDP协议端口，默认为514；格式之二为Unix套接字文件路径，但需要留心chroot应用及用户的读写权限；
 • <facility>：可以为syslog系统的标准facility之一；
 •<level>：定义日志级别，即输出信息过滤器，默认为所有信息；指定级别时，所有等于或高于此级别的日志信息将会被发送；
6、maxconn
maxconn <conns>
设定一个前端的最大并发连接数，因此，其不能用于backend区段。对于大型站点来说，可以尽可能提高此值以便让haproxy管理连接队列，从而避免无法应答用户请求。当然，此最大值不能超出“global”段中的定义。此外，需要留心的是，haproxy会为每个连接维持两个缓冲，每个缓冲的大小为8KB，再加上其它的数据，每个连接将大约占用17KB的RAM空间。这意味着经过适当优化后，有着1GB的可用RAM空间时将能维护40000-50000并发连接。
如果为<conns>指定了一个过大值，极端场景下，其最终占据的空间可能会超出当前主机的可用内存，这可能会带来意想不到的结果；因此，将其设定了一个可接受值方为明智决定。其默认为2000。
7、default_backend
default_backend<backend>
在没有匹配的”use_backend”规则时为实例指定使用的默认后端，因此，其不可应用于backend区段。在”frontend”和”backend”之间进行内容交换时，通常使用”use-backend”定义其匹配规则；而没有被规则匹配到的请求将由此参数指定的后端接收。
 • <backend>：指定使用的后端的名称；
使用案例：
use_backend dynamic ifurl_dyn
use_backend static ifurl_css url_img extension_img
default_backend dynamic
8、server
server <name><address>[:port] [param*]
为后端声明一个server，因此，不能用于defaults和frontend区段。
 •<name>：为此服务器指定的内部名称，其将出现在日志及警告信息中；如果设定了”http-send-server-name”，它还将被添加至发往此服务器的请求首部中；
 •<address>：此服务器的的IPv4地址，也支持使用可解析的主机名，只不过在启动时需要解析主机名至相应的IPv4地址；
 •[:port]：指定将连接请求所发往的此服务器时的目标端口，其为可选项；未设定时，将使用客户端请求时的同一相端口；
 •[param*]：为此服务器设定的一系参数；其可用的参数非常多，具体请参考官方文档中的说明，下面仅说明几个常用的参数；
服务器或默认服务器参数：
backup：设定为备用服务器，仅在负载均衡场景中的其它server均不可用于启用此server；
check：启动对此server执行健康状态检查，其可以借助于额外的其它参数完成更精细的设定，如：
inter<delay>：设定健康状态检查的时间间隔，单位为毫秒，默认为2000；也可以使用fastinter和downinter来根据服务器端状态优化此时间延迟；
rise<count>：设定健康状态检查中，某离线的server从离线状态转换至正常状态需要成功检查的次数；
fall<count>：确认server从正常状态转换为不可用状态需要检查的次数；
cookie<value>：为指定server设定cookie值，此处指定的值将在请求入站时被检查，第一次为此值挑选的server将在后续的请求中被选中，其目的在于实现持久连接的功能；
maxconn<maxconn>：指定此服务器接受的最大并发连接数；如果发往此服务器的连接数目高于此处指定的值，其将被放置于请求队列，以等待其它连接被释放；
haproxy有n个进程，每个支持m个连接，后端有x个服务器，每个最大支持y个连接，则 n*m <= x*y，如果后端服务器支持排队，则n*m <=x*（y+z），z为每个服务器的排队队列
maxqueue<maxqueue>：设定请求队列的最大长度；
observe<mode>：通过观察服务器的通信状况来判定其健康状态，默认为禁用，其支持的类型有“layer4”和“layer7”，“layer7”仅能用于http代理场景；
redir<prefix>：启用重定向功能，将发往此服务器的GET和HEAD请求均以302状态码响应；需要注意的是，在prefix后面不能使用/，且不能使用相对地址，以免造成循环；例如：
serversrv1 172.16.100.6:80 redir http://xxx.xxxx.com check
weight<weight>：权重，默认为1，最大值为256，0表示不参与负载均衡（不被调度）；
option httpchk：不能用于frontend段，例如：
backend https_relaymode tcp
optionhttpchk OPTIONS * HTTP/1.1\r\nHost:\ www.xxx.com
server apache1192.168.1.1:443 check port 80
使用案例：
server first172.16.100.7:1080 cookie first check inter 1000
server second172.16.100.8:1080 cookie second check inter 1000
9、capturerequest header
capture request header<name> len <length>
捕获并记录指定的请求首部最近一次出现时的第一个值，仅能用于“frontend”和“listen”区段。捕获的首部值使用花括号{}括起来后添加进日志中。如果需要捕获多个首部值，它们将以指定的次序出现在日志文件中，并以竖线“|”作为分隔符。不存在的首部记录为空字符串，最常需要捕获的首部包括在虚拟主机环境中使用的“Host”、上传请求首部中的“Content-length”、快速区别真实用户和网络机器人的“User-agent”，以及代理环境中记录真实请求来源的“X-Forward-For”。
 •<name>：要捕获的首部的名称，此名称不区分字符大小写，但建议与它们出现在首部中的格式相同，比如大写首字母。需要注意的是，记录在日志中的是首部对应的值，而非首部名称。
 • <length>：指定记录首部值时所记录的精确长度，超出的部分将会被忽略。
可以捕获的请求首部的个数没有限制，但每个捕获最多只能记录64个字符。为了保证同一个frontend中日志格式的统一性，首部捕获仅能在frontend中定义。
10、captureresponse header
capture response header<name> len <length>
捕获并记录响应首部，其格式和要点同请求首部。
11、 statsenable
启用基于程序编译时默认设置的统计报告，不能用于“frontend”区段。只要没有另外的其它设定，它们就会使用如下的配置：
- stats uri :/haproxy?stats
- stats realm :"HAProxy Statistics"
- stats auth : noauthentication
- stats scope : norestriction
尽管“statsenable”一条就能够启用统计报告，但还是建议设定其它所有的参数，以免其依赖于默认设定而带来非期后果。下面是一个配置案例。
backend public_www
serverwebsrv1 172.16.100.11:80
statsenable
statshide-version
statsscope . stats uri /haproxyadmin?stats
statsrealm Haproxy\ Statistics
statsauth statsadmin:password
statsauth statsmaster:password
12、statshide-version
stats hide-version
启用统计报告并隐藏HAProxy版本报告，不能用于“frontend”区段。默认情况下，统计页面会显示一些有用信息，包括HAProxy的版本号，然而，向所有人公开HAProxy的精确版本号是非常有风险的，因为它能帮助恶意用户快速定位版本的缺陷和漏洞。尽管“statshide-version”一条就能够启用统计报告，但还是建议设定其它所有的参数，以免其依赖于默认设定而带来非期后果。具体请参照“statsenable”一节的说明。
13、statsrealm
stats realm<realm>
启用统计报告并高精认证领域，不能用于“frontend”区段。haproxy在读取realm时会将其视作一个单词，因此，中间的任何空白字符都必须使用反斜线进行转义。此参数仅在与“statsauth”配置使用时有意义。
 •<realm>：实现HTTP基本认证时显示在浏览器中的领域名称，用于提示用户输入一个用户名和密码。
尽管“statsrealm”一条就能够启用统计报告，但还是建议设定其它所有的参数，以免其依赖于默认设定而带来非期后果。具体请参照“stats enable”一节的说明。
14、statsscope
stats scope {<name> | "." }
启用统计报告并限定报告的区段，不能用于“frontend”区段。当指定此语句时，统计报告将仅显示其列举出区段的报告信息，所有其它区段的信息将被隐藏。如果需要显示多个区段的统计报告，此语句可以定义多次。需要注意的是，区段名称检测仅仅是以字符串比较的方式进行，它不会真检测指定的区段是否真正存在。
 •<name>：可以是一个“listen”、“frontend”或“backend”区段的名称，而“.”则表示statsscope语句所定义的当前区段。
尽管“statsscope”一条就能够启用统计报告，但还是建议设定其它所有的参数，以免其依赖于默认设定而带来非期后果。下面是一个配置案例。
backendprivate_monitoring
statsenable
statsuri /haproxyadmin?stats
statsrefresh 10s
15、stats auth
stats auth<user>:<passwd>
启用带认证的统计报告功能并授权一个用户帐号，其不能用于“frontend”区段。
<user>：授权进行访问的用户名；
<passwd>：此用户的访问密码，明文格式；
此语句将基于默认设定启用统计报告功能，并仅允许其定义的用户访问，其也可以定义多次以授权多个用户帐号。可以结合“statsrealm”参数在提示用户认证时给出一个领域说明信息。在使用非法用户访问统计功能时，其将会响应一个“401 Forbidden”页面。其认证方式为HTTPBasic认证，密码传输会以明文方式进行，因此，配置文件中也使用明文方式存储以说明其非保密信息故此不能相同于其它关键性帐号的密码。
尽管“statsauth”一条就能够启用统计报告，但还是建议设定其它所有的参数，以免其依赖于默认设定而带来非期后果。
16、statsadmin
stats admin { if |unless } <cond>
在指定的条件满足时启用统计报告页面的管理级别功能，它允许通过web接口启用或禁用服务器，不过，基于安全的角度考虑，统计报告页面应该尽可能为只读的。此外，如果启用了HAProxy的多进程模式，启用此管理级别将有可能导致异常行为。
目前来说，POST请求方法被限制于仅能使用缓冲区减去保留部分之外的空间，因此，服务器列表不能过长，否则，此请求将无法正常工作。因此，建议一次仅调整少数几个服务器。下面是两个案例，第一个限制了仅能在本机打开报告页面时启用管理级别功能，第二个定义了仅允许通过认证的用户使用管理级别功能。
backend stats_localhost
statsenable
statsadmin if LOCALHOST
backend stats_auth
statsenable
statsauth haproxy admin:password
statsadmin if TRUE
17、optionhttplog
option httplog [ clf ]
启用记录HTTP请求、会话状态和计时器的功能。
clf：使用CLF格式来代替HAProxy默认的HTTP格式，通常在使用仅支持CLF格式的特定日志分析器时才需要使用此格式。
默认情况下，日志输入格式非常简陋，因为其仅包括源地址、目标地址和实例名称，而“optionhttplog”参数将会使得日志格式变得丰富许多，其通常包括但不限于HTTP请求、连接计时器、会话状态、连接数、捕获的首部及cookie、“frontend”、“backend”及服务器名称，当然也包括源地址和端口号等。
18、optionlogasap
option logasap
no option logasap
启用或禁用提前将HTTP请求记入日志，不能用于“backend”区段。
默认情况下，HTTP请求是在请求结束时进行记录以便能将其整体传输时长和字节数记入日志，由此，传较大的对象时，其记入日志的时长可能会略有延迟。“optionlogasap”参数能够在服务器发送complete首部时即时记录日志，只不过，此时将不记录整体传输时长和字节数。此情形下，捕获“Content-Length”响应首部来记录传输的字节数是一个较好选择。下面是一个例子。
listen http_proxy0.0.0.0:80
modehttp
optionhttplog
optionlogasap
log172.16.100.9 local2
19、 optionforwardfor
option forwardfor [except <network> ] [ header <name> ] [ if-none ]
允许在发往服务器的请求首部中插入“X-Forwarded-For”首部。
<network>：可选参数，当指定时，源地址为匹配至此网络中的请求都禁用此功能。
<name>：可选参数，可使用一个自定义的首部，如“X-Client”来替代“X-Forwarded-For”。有些独特的web服务器的确需要用于一个独特的首部。
if-none：仅在此首部不存在时才将其添加至请求报文问道中。
HAProxy工作于反向代理模式，其发往服务器的请求中的客户端IP均为HAProxy主机的地址而非真正客户端的地址，这会使得服务器端的日志信息记录不了真正的请求来源，“X-Forwarded-For”首部则可用于解决此问题。HAProxy可以向每个发往服务器的请求上添加此首部，并以客户端IP为其value。
需要注意的是，HAProxy工作于隧道模式，其仅检查每一个连接的第一个请求，因此，仅第一个请求报文被附加此首部。如果想为每一个请求都附加此首部，请确保同时使用了“optionhttpclose”、“option forceclose”和“option http-server-close”几个option。
下面是一个例子。
frontend www
modehttp
optionforwardfor except 127.0.0.1
20、errorfile
errorfile <code><file>
在用户请求不存在的页面时，返回一个页面文件给客户端而非由haproxy生成的错误代码；可用于所有段中。
<code>：指定对HTTP的哪些状态码返回指定的页面；这里可用的状态码有200、400、403、408、500、502、503和504；
<file>：指定用于响应的页面文件；
例如：
errorfile 400/etc/haproxy/errorpages/400badreq.http
errorfile 403/etc/haproxy/errorpages/403forbid.http
errorfile 503/etc/haproxy/errorpages/503sorry.http
21、errorloc 和errorloc302
errorloc <code><url>
errorloc302<code> <url>
请求错误时，返回一个HTTP重定向至某URL的信息；可用于所有配置段中。
<code>：指定对HTTP的哪些状态码返回指定的页面；这里可用的状态码有200、400、403、408、500、502、503和504；
<url>：Location首部中指定的页面位置的具体路径，可以是在当前服务器上的页面的相对路径，也可以使用绝对路径；需要注意的是，如果URI自身错误时产生某特定状态码信息的话，有可能会导致循环定向；
需要留意的是，这两个关键字都会返回302状态吗，这将使得客户端使用同样的HTTP方法获取指定的URL，对于非GET法的场景(如POST)来说会产生问题，因为返回客户的URL是不允许使用GET以外的其它方法的。如果的确有这种问题，可以使用errorloc303来返回303状态码给客户端。
22、errorloc303
errorloc303<code> <url>
请求错误时，返回一个HTTP重定向至某URL的信息给客户端；可用于所有配置段中。
<code>：指定对HTTP的哪些状态码返回指定的页面；这里可用的状态码有400、403、408、500、502、503和504；
<url>：Location首部中指定的页面位置的具体路径，可以是在当前服务器上的页面的相对路径，也可以使用绝对路径；需要注意的是，如果URI自身错误时产生某特定状态码信息的话，有可能会导致循环定向；
例如：
backend webserver
server172.16.100.6 172.16.100.6:80 check maxconn 3000 cookie srv01
server172.16.100.7 172.16.100.7:80 check maxconn 3000 cookie srv02
errorloc403 /etc/haproxy/errorpages/sorry.htm
errorloc503 /etc/haproxy/errorpages/sorry.htm
 
六、ACL
haproxy的ACL用于实现基于请求报文的首部、响应报文的内容或其它的环境状态信息来做出转发决策，这大大增强了其配置弹性。其配置法则通常分为两步，首先去定义ACL，即定义一个测试条件，而后在条件得到满足时执行某特定的动作，如阻止请求或转发至某特定的后端。定义ACL的语法格式如下。
acl <aclname><criterion> [flags] [operator] <value> ...
<aclname>：ACL名称，区分字符大小写，且其只能包含大小写字母、数字、-(连接线)、_(下划线)、.(点号)和:(冒号)；haproxy中，acl可以重名，这可以把多个测试条件定义为一个共同的acl；
<criterion>：测试标准，即对什么信息发起测试；测试方式可以由[flags]指定的标志进行调整；而有些测试标准也可以需要为其在之前指定一个操作符[operator]；
[flags]：目前haproxy的acl支持的标志位有3个：
-i：不区分中模式字符的大小写；
-f：从指定的文件中加载模式；
--：标志符的强制结束标记，在模式中的字符串像标记符时使用；
 • <value>：acl测试条件支持的值有以下四类：
整数或整数范围：如1024:65535表示从1024至65535；仅支持使用正整数(如果出现类似小数的标识，其为通常为版本测试)，且支持使用的操作符有5个，分别为eq、ge、gt、le和lt；
字符串：支持使用“-i”以忽略字符大小写，支持使用“\”进行转义；如果在模式首部出现了-i，可以在其之前使用“–”标志位；
正则表达式：其机制类同字符串匹配；
IP地址及网络地址；
同一个acl中可以指定多个测试条件，这些测试条件需要由逻辑操作符指定其关系。条件间的组合测试关系有三种：“与”(默认即为与操作)、“或”(使用“||”操作符)以及“非”(使用“!”操作符)。
常用的测试标准(criteria)
1、be_sess_rate
be_sess_rate(backend)<integer>
用于测试指定的backend上会话创建的速率(即每秒创建的会话数)是否满足指定的条件；常用于在指定backend上的会话速率过高时将用户请求转发至另外的backend，或用于阻止攻击行为。例如：
backend dynamic
modehttp
aclbeing_scanned be_sess_rate gt 50
redirectlocation /error_pages/denied.html if being_scanned
2、fe_sess_rate
fe_sess_rate(frontend)<integer>
用于测试指定的frontend(或当前frontend)上的会话创建速率是否满足指定的条件；常用于为frontend指定一个合理的会话创建速率的上限以防止服务被滥用。例如下面的例子限定入站邮件速率不能大于50封/秒，所有在此指定范围之外的请求都将被延时50毫秒。
frontend mail
bind:25
modetcp
maxconn500
acltoo_fast fe_sess_rate ge 50
tcp-requestinspect-delay 50ms
tcp-requestcontent accept if ! too_fast
tcp-requestcontent accept if WAIT_END
3、hdr <string>
hdr(header)<string>
用于测试请求报文中的所有首部或指定首部是否满足指定的条件；指定首部时，其名称不区分大小写，且在括号“()”中不能有任何多余的空白字符。测试服务器端的响应报文时可以使用shdr()。例如下面的例子用于测试首部Connection的值是否为close。
hdr(Connection) -iclose
4、method <string>
method <string>
测试HTTP请求报文中使用的方法。
5、path_beg <string>
用于测试请求的URL是否以指定的模式开头。下面的例子用于测试URL是否以/static、/images、/javascript或/stylesheets头。
acl url_static path_beg-i /static /images /javascript /stylesheets
6、path_end <string>
用于测试请求的URL是否以<string>指定的模式结尾。例如，下面的例子用户测试URL是否以jpg、gif、png、css或js结尾。
acl url_static path_end-i .jpg .gif .png .css .js
7、 hdr_beg <string>
用于测试请求报文的指定首部的开头部分是否符合<string>指定的模式。例如，下面的例子用记测试请求是否为提供静态内容的主机img、video、download或ftp。
acl host_statichdr_beg(host) -i img. video. download. ftp.
8、hdr_end <string>
用于测试请求报文的指定首部的结尾部分是否符合<string>指定的模式。
 
七、配置案例
前端调度器IP：192.168.1.210
后端应用服务器IP:192.168.1.111 和 192.168.1.112
1、定义独立日志文件
# vim /etc/rsyslog.conf#为其添加日志功能
# Provides UDP syslogreception
$ModLoadimudp
$UDPServerRun514------>启动udp，启动端口后将作为服务器工作
# Provides TCP syslogreception
$ModLoad imtcp
$InputTCPServerRun514------>启动tcp监听端口
local2.* /var/log/haproxy.log
# service rsyslogrestar
# vim haproxy.cfg
log127.0.0.1local2--------->在global端中添加此行
2、一个最简单的http服务的配置
global
log 127.0.0.1 local2
chroot /var/lib/haproxy
pidfile/var/run/haproxy.pid
maxconn 4000
userhaproxy
group haproxy
daemon
statssocket /var/lib/haproxy/stats
defaults
mode http
logglobal
option httplog
optiondontlognull
optionhttp-server-close
optionforwardfor except127.0.0.0/8
option redispatch
retries3
timeout http-request 10s
timeout queue 1m
timeout connect 10s
timeout client 1m
timeout server 1m
timeouthttp-keep-alive10s
timeout check 10s
maxconn3000
frontend  webser         #webser为名称
optionforwardfor
bind*:80
default_backendapp
backend app
balance roundrobin     #使拥roundrobin 算法
server app1192.168.1.111:80 check
server app2 192.168.1.112:80 check
3、haproxy统计页面的输出机制
frontend webser
log 127.0.0.1 local3
option forwardfor
bind*:80
default_backend app
backendapp
cookie nodeinsert nocache
balanceroundrobin
serverapp1 192.168.1.111:80 check cookie node1 intval2 rise1 fall2
serverapp2 192.168.1.112:80 check cookie node2 intval2 rise1 fall2
serverbackup 127.0.0.1:8010checkbackup
listen statistics
bind *:8009         # 自定义监听端口
stats enable        # 启用基于程序编译时默认设置的统计报告
stats auth admin:admin        # 统计页面用户名和密码设置
stats uri/admin?stats         #自定义统计页面的URL，默认为/haproxy?stats
statshide-version             # 隐藏统计页面上HAProxy的版本信息
stats refresh 30s        # 统计页面自动刷新时间
stats admin if TRUE       #如果认证通过就做管理功能，可以管理后端的服务器
stats realm Hapadmin    #统计页面密码框上提示文本，默认为Haproxy\ Statistics
4、动静分离示例
frontend webservs
bind*:80
aclurl_static path_beg -i /static /images /javascript /stylesheets
aclurl_static path_end -i .jpg .gif .png .css .js .html
aclurl_php path_end -i .php
aclhost_static hdr_beg(host) -i img. imgs. video. videos. ftp. image. download.
use_backendstatic if url_static or host_static
use_backenddynamic if url_php
default_backenddynamic
backend static
balanceroundrobin
servernode1 192.168.1.111:80 check maxconn 3000
backend dynamic
balanceroundrobin
servernode2 192.168.1.112:80 check maxconn 1000
5、http完整配置
#---------------------------------------------------------------------
# Global settings
#---------------------------------------------------------------------
global
# to have thesemessages end up in /var/log/haproxy.log you will
# need to:
#
# 1) configure syslogto accept network log events. This is done
# by adding the '-r'option to the SYSLOGD_OPTIONS in
# /etc/sysconfig/syslog
#
# 2) configure local2events to go to the /var/log/haproxy.log
# file. A line like thefollowing can be added to
# /etc/sysconfig/syslog
#
# local2.*/var/log/haproxy.log
#
log127.0.0.1 local2
chroot/var/lib/haproxy
pidfile/var/run/haproxy.pid
maxconn4000
userhaproxy
grouphaproxy
daemon
defaults
modehttp
logglobal
optionhttplog
optiondontlognull
optionhttp-server-close
optionforwardfor except 127.0.0.0/8
optionredispatch
retries3
timeouthttp-request 10s
timeoutqueue 1m
timeoutconnect 10s
timeoutclient 1m
timeoutserver 1m
timeouthttp-keep-alive 10s
timeoutcheck 10s
maxconn30000
listen stats
modehttp
bind0.0.0.0:1080
statsenable
statshide-version
statsuri /haproxyadmin?stats
statsrealm Haproxy\ Statistics
statsauth admin:admin
statsadmin if TRUE
frontend http-in
bind*:80
modehttp
logglobal
optionhttpclose
optionlogasap #不等待响应结束就记录日志，表示提前记录日志，一般日志会记录响应时长，此不记录响应时长
optiondontlognull #不记录空信息
capturerequest header Host len 20 #记录请求首部的前20个字符
capturerequest header Referer len 60 #referer跳转引用，就是上一级
default_backendservers
frontend healthcheck
bind:1099 #定义外部检测机制
modehttp
optionhttpclose
optionforwardfor
default_backendservers
backend servers
balanceroundrobin
serverwebsrv1 192.168.1.111:80 check maxconn 2000
serverwebsrv2 192.168.1.112:80 check maxconn 2000
6、mysql负载均衡实例
 
#---------------------------------------------------------------------
# Global settings
#---------------------------------------------------------------------
global
# to have thesemessages end up in /var/log/haproxy.log you will
# need to:
#
# 1) configure syslogto accept network log events. This is done
# by adding the '-r'option to the SYSLOGD_OPTIONS in
# /etc/sysconfig/syslog
#
# 2) configure local2events to go to the /var/log/haproxy.log
# file. A line like thefollowing can be added to
# /etc/sysconfig/syslog
#
# local2.*/var/log/haproxy.log
#
log127.0.0.1 local2
chroot/var/lib/haproxy
pidfile/var/run/haproxy.pid
maxconn4000
userhaproxy
grouphaproxy
daemon
defaults
modetcp
logglobal
optionhttplog
optiondontlognull
retries3
timeouthttp-request 10s
timeoutqueue 1m
timeoutconnect 10s
timeoutclient 1m
timeoutserver 1m
timeouthttp-keep-alive 10s
timeoutcheck 10s
maxconn600
listen stats
modehttp
bind0.0.0.0:1080
statsenable
statshide-version
statsuri /haproxyadmin?stats
statsrealm Haproxy\ Statistics
statsauth admin:admin
statsadmin if TRUE
frontend mysql
bind*:3306
modetcp
logglobal
default_backendmysqlservers
backend mysqlservers
balanceleastconn
serverdbsrv1 192.168.1.111:3306 check port 3306 intval 2 rise 1 fall 2 maxconn 300
serverdbsrv2 192.168.1.112:3306 check port 3306 intval 2 rise 1 fall 2 maxconn 300
 
--------------------- 
参考原文：https://blog.csdn.net/bbwangj/article/details/80337994